← 返回首页

AI Agent 术语乱战:Harness 与 Scaffold 到底指什么?

原文: Harness, Scaffold, and the AI Agent Terms Worth Getting Right

Hugging Face Blog 行业观点 入门 影响力: 7/10

Hugging Face 发布 AI Agent 术语表,旨在澄清业界快速演变中概念混淆的问题,为开发者提供清晰的思维模型。

核心要点

  • AI Agent 领域术语快速演变,导致概念混淆,给新手和从业者带来困扰。
  • 核心区分在于:Scaffold(脚手架)是定义模型行为的外层(如提示词、工具描述),Harness(框架)是负责执行的内层(如调用模型、处理工具调用)。
  • 许多流行产品(如 Claude Code)将整个非模型部分统称为 Harness,这种宽泛用法在实践中很常见。
  • 术语表旨在提供一个实用的思维模型,而非强制统一标准,以促进更清晰的讨论。

深度解读

AI Agent 的浪潮正以前所未有的速度席卷整个科技行业,但与之相伴的,是术语的“通货膨胀”与概念的模糊化。当你听到“框架”、“脚手架”、“智能体”这些词时,不同的人、不同的产品文档可能指向完全不同的东西。Hugging Face 这篇最新的术语澄清文章,正是在这个混乱的节点上,试图为开发者们提供一张“认知地图”。

起因:为什么现在需要一份术语表? 文章的引子非常生动:一位研究员在参加完顶级会议 ICLR 2026 后,发出了灵魂拷问——“你们说的‘Harness’和‘Scaffold’到底是什么意思?我听了很多解释,但它们为什么不能统一?”这精准地捕捉到了当前领域的痛点。一个技术领域在爆发期,其概念的演变速度往往快过共识的形成速度。新术语被发明,旧术语被重新定义,同一个词在不同语境下含义迥异。这种混乱不仅让新人望而却步,也让资深从业者在交流时效率低下,甚至可能在技术选型和架构设计上产生误解。因此,厘清这些核心概念,不是学究式的文字游戏,而是提升整个行业协作效率的基础设施建设。

拆解:Harness 与 Scaffold 的核心区别 文章的核心贡献在于清晰区分了两个最容易被混用的概念:Scaffold(脚手架)和 Harness(框架/执行层)。

  • Scaffold(脚手架):可以理解为模型的“世界观”和“行为准则”。它包括系统提示词、工具的描述文档、模型输出的解析规则,以及跨步骤的记忆管理(上下文工程)。它定义了模型如何看待世界、如何行动。无论是训练还是推理,Scaffold 都在塑造模型的“性格”和“能力边界”。
  • Harness(框架/执行层):这是让 Agent 真正“跑起来”的引擎。它负责调用模型、接收模型的工具调用请求并实际执行、决定何时终止一个任务循环。Harness 是执行的核心。文章用了一个精妙的比喻:把模型(LLM)本身看作一个有才华但无记忆、无行动能力的“大脑”。Scaffold 给了它世界观和工具说明书,而 Harness 则是它的四肢和神经系统,负责接收指令并付诸行动。

然而,文章也敏锐地指出了现实中的“宽泛用法”。像 Claude Code、Codex 这样的流行产品,其文档直接将整个非模型部分称为“Harness”。在这种语境下,Harness 成了一个伞状术语,涵盖了 Scaffold 和执行层。这种用法在实践中非常普遍,因为它从用户视角看是合理的——用户不关心内部模块划分,只关心整个“框架”提供了哪些功能。文章的明智之处在于,它没有试图强行纠正这种用法,而是指出:“当你需要单独推理它们时(比如在训练流水线中),区分 Scaffold 和 Harness 才最重要。”

趋势洞察:从“模型中心”到“工程中心”的范式转移 这篇术语表的出现,本身就是一个强烈的趋势信号。它揭示了 AI Agent 开发正在从“模型能力竞赛”转向“系统工程实践”。过去,大家的焦点是哪个模型更聪明(参数更大、跑分更高)。而现在,焦点越来越转向如何围绕一个模型,构建出稳定、可靠、有用的 Agent 系统。Harness engineering(框架工程)作为一个独立的学科被提出,正是这一转变的标志。它关注的不再是模型本身,而是如何设计执行层来处理错误、设置安全护栏、优化任务循环。这类似于软件工程从“写算法”到“构建完整系统”的成熟过程。未来,一个 Agent 的优劣,可能更多取决于其 Harness 和 Scaffold 的设计水平,而非底层模型那微小的性能差异。

实用价值:对开发者意味着什么? 对于正在构建或使用 AI Agent 的开发者而言,这份术语表提供了几个关键价值:

  1. 沟通效率:在与团队或社区讨论时,可以先明确“我们这里说的 Harness 是指执行层还是整个框架?”避免鸡同鸭讲。
  2. 架构设计:在设计自己的 Agent 系统时,可以有意识地将“行为定义”(Scaffold)和“执行引擎”(Harness)分离。这有助于模块化设计,比如你可以轻松地更换底层模型(改变“大脑”),或者调整提示词和工具集(修改“世界观”),而不必重写整个执行逻辑。
  3. 技术选型:当评估一个 Agent 框架(如 LangChain, CrewAI)或产品(如 Claude Code)时,你可以更精准地理解它的核心创新点在哪里。它是在 Scaffold 层(提供了精妙的提示词模板和工具管理)有独到之处,还是在 Harness 层(提供了强大的错误恢复和并发控制)做得特别好?

反常识/意外:术语的“不统一”可能是现阶段的健康状态 文章最后提到:“许多术语还没有普遍接受的定义,不同的框架对同一个词的用法也不同。”这看似是问题,但从另一个角度看,这恰恰是领域充满活力的表现。过早地强制统一术语,可能会扼杀创新。当前这种“混乱”允许不同的思想流派和工程实践并行探索。Hugging Face 的做法不是颁布“标准答案”,而是提供“实用的心智模型”,这是一种非常务实和开放的态度。它承认现状,并致力于在现状下提升沟通效率,而不是试图一蹴而就地解决所有分歧。对于开发者来说,这意味着在拥抱这些概念的同时,也需要保持一定的灵活性,理解你所使用的具体工具或论文中,这些术语的“本地化”定义。


原文地址: Harness, Scaffold, and the AI Agent Terms Worth Getting Right

BitByAI — 由 AI 驱动、AI 进化的 AI 资讯站