LlamaIndex推出Retrieval Harness:让AI代理像开发者一样翻阅文件
原文: Announcing Retrieval Harness
LlamaIndex发布Retrieval Harness,为AI代理提供文件列表、精确Grep、分块读取等文件系统原语,解决语义搜索的碎片化问题。
- 提供四个文件系统工具,让Agent可精确操作文档
- 解决语义搜索跨块断裂问题,避免上下文丢失
- 保留文档视觉布局,处理表格和图表等结构化内容
- 从静态RAG到动态文件遍历,推动Agent向确定性行动演进
起因:RAG 已经不够用了,Agent 需要文件系统 过去一年,基于 RAG(检索增强生成)的应用铺天盖地。但 LlamaIndex 团队发现,当他们的用户开始构建真正的企业 Agent 时,传统的“先切片,再搜索”模式很快失效了。于是,他们推出了 Retrieval Harness,一套专为 Agent 设计的文件系统原语。这背后的逻辑很简单:人类开发者找信息时,不会只依赖一次模糊搜索——我们会 ls 看目录、grep 精确匹配、打开文件读上下文。Agent 也需要这样的能力。
拆解:四个文件系统工具和一个杀手级功能 Retrieval Harness 把知识库暴露出四个类似 Unix 命令的 API:
- Hybrid Retrieve:混合向量+关键词+重排序,快速定位相关文件;
- List Files:让 Agent 知道索引里有哪些文件,就像 ls;
- File Grep:服务器端正则扫描,Agent 可以精确查找特定字符串(如产品序列号),无需返回整个语义块;
- File Read:当语义块被截断时,Agent 可以调用一个直接读取 API,获取周围的完整上下文。 此外,他们还加入了视觉布局保留——解析文档时直接捕捉页面截图,并与文本块关联。这对于表格、财务报表、结构图等依赖布局的内容至关重要。Agent 可以直接“看”原页面,避免文字化丢失信息。
趋势洞察:从 RAG 到 RAA(检索增强行动) 这个发布标志着一个关键转变:AI 应用正从“检索信息”走向“执行动作”。Agent 不再是被动接收上下文,而是主动探索和操作数据。传统的 RAG 管线是静态的:生成时拼凑几个片段,好坏全看运气。而 Retrieval Harness 提供的是动态、确定性工具,让 Agent 能像资深工程师一样,在文档森林里按图索骥。这意味着 RAG 正在演化为 RAA(Retrieval-Augmented Action),或者更准确地说,是 RAG 与 Agent 的深度融合。
实用价值:开发者现在可以做什么? 对于正在构建企业 Agent 的团队,这个工具直接解决了几个痛点:成本(避免盲目加载整个文件)、准确性(精确定位避免幻觉)、可观测性(清晰的日志和指标)。你可以立即用 LlamaParse Index 创建这样的索引,并通过标准的 API 调用让 Agent 使用这些文件系统工具。特别是处理复杂的法律合同、技术手册或金融报告时,File Grep 和 Read 能大幅降低 token 消耗,同时提升回答的可靠性。
反常识:语义搜索不是银弹,确定性工具才是 Agent 的基石 很多开发者过度迷信向量搜索,但实际业务中,大量查询是精确的(如某个订单号)。用语义搜索可能返回一堆不相关的结果,然后让 Agent 在混乱中迷失。Retrieval Harness 的思路是回归文件系统的基本体验:先搜、再列、再 grep、再读——这正是人类处理信息的本质路径。AI Agent 不是魔法,它需要一套系统工程工具箱,而文件系统原语就是拼图中最关键的一块。
分析由 BitByAI 生成 · 阅读原文