AI Agent 评估实战指南:从手动追踪到自动化测试的完整清单 LangChain 团队提出了一套从手动审查真实 Agent 追踪开始,逐步构建评估体系的实用清单,强调先理解失败模式再自动化。 LangChain Blog ·