标签: 系统工程 (6 篇)

告别模型崇拜：Hugging Face 推出首个「全栈」AI 智能体排行榜

Hugging Face 联合 IBM 推出 Open Agent Leaderboard，首次将评估对象从单一模型扩展到包含工具、规划、记忆的完整智能体系统，并同时衡量性能与成本。

Hugging Face Blog · 2026年5月18日

Hugging Face揭示连续批处理中CPU与GPU交替等待的瓶颈，通过异步化实现两者并行，可免费获得高达24%的推理吞吐量提升。

Hugging Face Blog · 2026年5月14日

ServiceNow AI团队在将强化学习训练从vLLM V0迁移到V1时，发现推理引擎的微小差异会导致训练崩溃，通过修复四个关键后端问题恢复了训练稳定性。

Hugging Face Blog · 2026年5月7日

Hugging Face文章指出，AI驱动的自主网络安全系统（如Mythos）的崛起，揭示了开源在分布式防御、应对闭源软件风险方面的关键结构性优势。

Hugging Face Blog · 2026年4月21日

Anthropic澄清Claude Code质量下降非模型问题，而是工程框架中三个复杂缺陷所致，揭示了AI Agent系统工程化的深层挑战。

Simon Willison ·

LangChain 提出“Better-Harness”系统，将评估（evals）视为Agent的“训练数据”，通过迭代优化工程框架（harness）来提升智能体性能，核心是避免过拟合并实现泛化。

LangChain Blog ·