从Claude 4.6到4.7：一份系统提示词更新背后的AI助手进化论

原文: Changes in the system prompt between Claude Opus 4.6 and 4.7

Anthropic发布的Claude Opus 4.7系统提示词更新，揭示了AI助手正从被动应答向主动工具调用、深度任务执行和更负责任的安全框架演进。

大语言模型 AI助手系统提示词工具调用 AI安全

核心要点

工具生态扩展：新增Claude in PowerPoint等工具，表明AI正深度集成到办公软件中
行为模式转变：新增‘行动vs澄清’指令，鼓励AI在不确定时先尝试用工具解决而非直接提问
安全框架强化：儿童安全部分被显著扩充并用特殊标签包裹，要求拒绝后对整个对话保持警惕
主动能力发现：引入tool_search机制，AI在声称‘无法访问’某功能前会先主动搜索可用工具

深度解读

起因：一份“透明”的系统提示词更新

在AI行业普遍将系统提示词视为核心机密的背景下，Anthropic坚持公开其面向用户的Claude.ai系统提示词，这本身就为行业提供了一个独特的观察窗口。Simon Willison对Claude Opus 4.6到4.7版本间提示词变化的分析，不仅仅是技术爱好者的“找不同”游戏，更是我们理解AI助手如何被“塑造”和“驯化”的绝佳案例。这次更新发生在2026年4月，距离上一次更新仅两个多月，其变化之密集，值得深入解读。

拆解：四大核心变化，揭示AI助手的“性格”养成

首先，工具生态的显性化与集成化。系统提示词中明确列出了“Claude in Excel”、“Claude in Powerpoint”等工具，并指出“Claude Cowork可以将所有这些作为工具使用”。这绝非简单的功能列表更新。它意味着AI助手的角色正从一个独立的聊天机器人，转变为一个嵌入具体生产力场景的“协作中枢”。用户与AI的交互，将越来越多地发生在Word、Excel、PPT这些熟悉的办公环境中，AI成为其中的智能代理。这预示着AI应用的主战场，正从独立的聊天界面，迁移到现有的软件生态里。

其次，交互逻辑的根本性调整：从“提问者”到“行动者”。新增的<acting_vs_clarifying>部分是本次更新的精髓。它明确告诉Claude：“当请求的细节不明确时，用户通常希望你现在就做出合理的尝试，而不是先接受采访。” 更关键的是，它规定当有工具可以解决模糊性时——比如搜索、查日历——Claude应该先调用工具，而不是让用户自己去查。这彻底改变了AI的交互范式。过去我们习惯了AI不断追问以获取精确信息，现在它被鼓励先“动手试试”。这背后是AI能力（特别是工具调用能力）的自信，也是对用户体验的深刻洞察：用户要的是结果，不是一场冗长的需求澄清会。

第三，安全护栏的精细化与主动化。儿童安全部分被大幅扩充并用<critical_child_safety_instructions>标签重点标出。其中一条规定尤其值得注意：“一旦Claude因儿童安全原因拒绝了一个请求，同一对话中的所有后续请求都必须以极端谨慎的态度对待。” 这超越了单次内容过滤的范畴，建立了一种对话级的风险评估机制。AI的安全判断不再是一次性的，而是具有了“记忆”和“上下文关联性”，这反映了对复杂、多轮交互中潜在风险的更深理解。

最后，也是最具前瞻性的，AI的“自我认知”与能力发现机制。系统提示词引入了tool_search工具的指令：在声称“我无法访问X”之前，Claude必须先调用tool_search来检查是否有相关但被延迟加载的工具可用。这是一个革命性的概念。它意味着AI不再完全依赖于预先写死在系统提示词里的工具列表。它拥有了动态发现自身能力的机制。这就像一个人在说“我不会做这个”之前，先去查一下自己的技能库或工具箱。这为未来更灵活、可扩展的AI助手架构奠定了基础，AI的能力边界可以动态变化，而非静态固定。

趋势洞察：AI助手正在成为“主动的数字员工”

综合这些变化，一个清晰的趋势浮现出来：AI助手正从“应答式工具”进化为“主动的数字员工”。它被期望：1）深度融入工作流（在具体软件中发挥作用）；2）主动解决问题（先行动后提问）；3）承担更复杂的安全责任（基于上下文的风险评估）；4）具备自我管理和能力发现的意识。Anthropic通过系统提示词的迭代，正在精心设计一个更自主、更可靠、更集成的AI代理行为框架。

实用价值与反常识点

对于开发者和产品经理而言，这份更新提供了宝贵的“行为设计”蓝图。如果你想构建自己的AI代理，这些原则——鼓励行动而非追问、设计工具发现机制、建立对话级安全策略——都是可以直接借鉴的。

一个可能被忽略的反常识点是：系统提示词的“长度”和“复杂性”本身就是一个重要的产品信号。随着AI能力增强，引导其行为的规则不是变简单了，而是变得更复杂、更精细。这就像管理一个能力越强的员工，需要的规章制度和沟通成本也可能越高。Anthropic公开这些冗长而精密的提示词，恰恰展示了驾驭强大AI所需的“治理艺术”。

总之，Claude系统提示词的每一次更新，都像是AI助手“心智模型”的一次版本迭代。透过这些文字，我们看到的不仅是技术参数的调整，更是一个AI产品哲学和交互范式的持续演进。

原文地址: Changes in the system prompt between Claude Opus 4.6 and 4.7

分析由 BitByAI 生成 · 阅读原文

原文来自 Simon Willison · 由 BitByAI 自动解读