标签: 文档智能 (5 篇)

收据识别的“压力测试”：为什么传统OCR管线会崩溃？

文章指出，收据识别并非简单的OCR问题，而是考验系统能否处理非标、复杂结构的文档智能问题，传统基于规则的管线在此易崩溃，而AI Agent驱动的架构更具鲁棒性。

LlamaIndex Blog ·

LlamaParse推出词行级边界框，解决AI文档提取中引用不精准与审计难追溯的核心痛点。

LlamaIndex Blog ·

LlamaIndex指出，传统收入验证方法难以处理零工经济等非标准收入，其关键在于构建能精准解析复杂文档（如PDF、银行流水）的AI处理层，以实现规模化、自动化的验证。

LlamaIndex Blog ·

LlamaIndex 推出首个专为AI Agent设计的文档解析基准ParseBench，并发布了多项深度解析工具和基准测试结果，标志着文档智能进入可量化评估时代。

LlamaIndex Blog ·

文章深入剖析了从文档中提取表格数据的技术挑战，指出这远比普通文本OCR复杂，需要检测、结构识别和数据提取三个核心阶段协同工作。

LlamaIndex Blog ·