← 返回首页 — Simon Willison — 进阶
行业观点 · 深度解读 · IMPACT 7/10

别再给 AI 写死规则了:把判断权交还给 Agent 的正确姿势

原文: Fable's judgement

顶级 AI 编程工具的正确用法不是精细控制,而是赋予其自主判断与动态路由能力,让主模型专注架构决策,子代理处理具体实现。

核心要点
  • 从规则驱动转向意图驱动,允许 AI 自主判断测试与任务边界
  • 实施动态模型路由,主模型负责审查与合成,子代理执行具体编码
  • 高端模型的核心价值在于判断力而非代码生成量
  • 通过记忆文件配置可轻松实现分层代理工作流,大幅降低算力成本
深度解读

起因:从“写死规则”到“交出判断权” 知名开发者 Simon Willison 最近在与 Claude Code 团队的一次交流中,分享了一个看似反直觉却极其有效的 AI 协作技巧:别再给 Agent 写死规则了,学会把“判断权”交还给它。在 AI 编程工具快速迭代的当下,很多开发者依然习惯用写代码的逻辑去约束 AI,但这恰恰限制了顶级模型的发挥空间。

拆解:动态路由与分层代理架构 Simon 的实践核心其实就两点。第一是“意图驱动而非规则驱动”。比如测试环节,你不必费劲写“改动大于 50 行才跑测试,纯 UI 调整跳过”,直接告诉模型“请根据你的专业判断决定是否编写和运行测试”,它的决策往往更符合实际工程语境。第二是“动态模型路由”。他通过 Claude Code 的记忆文件,给主模型下达了一条核心指令:遇到编码任务时,自行评估复杂度,然后自动拉起子代理,把具体实现工作分配给更低成本的模型。高端模型只负责架构设计、逻辑合成与最终代码审查,脏活累活交给轻量模型干。

趋势洞察:AI 正在从“执行者”进化为“技术总监” 这揭示了一个更深层的行业趋势:我们与 AI 的交互范式,正在从“精细控制”转向“意图委派”。过去我们总把大模型当成需要手把手教的初级程序员,拼命用提示词里的条件分支框住它。但现在的顶级模型已经具备了足够的工程元认知。过度约束不仅浪费上下文窗口,还会干扰模型的推理链路。未来的 AI 编程工作流,拼的不是谁的指令写得长,而是谁能设计好“意图拆解、动态分发、质量验收”的流水线。

实用价值:立刻能落地的降本增效指南 对一线开发者而言,这套思路可以直接复用到日常开发中。你可以在项目中配置类似的记忆规则,让主模型扮演技术负责人的角色。这样做的直接收益是算力消耗大幅下降,且主上下文不会被冗长的实现代码污染,整体交互更流畅。你可以先从小模块开始测试,观察子代理的输出质量,逐步调整路由策略。

反常识:高端模型的真正价值不在“写代码” 很多人有个误区:既然开了最高级模型,就得让它干满所有活才回本。但其实,高端模型最稀缺、最不可替代的能力是“判断力”与“全局观”,而不是生成代码的速度。把执行层下放,把决策层保留,才是符合工程经济学的最优解。你以为在帮 AI 省算力,其实是在帮它回归架构师的本质。


原文地址: Fable's judgement

分析由 BitByAI 生成 · 阅读原文

原文来自 Simon Willison · 由 BitByAI 自动解读