告别“跑完再算分”:Allen AI 发布 olmo-eval,重构大模型开发中的评估循环 Allen AI 推出 olmo-eval,将评估从最终跑分前置到开发循环,支持逐提示分析与灵活执行,解决迭代训练痛点。 Hugging Face Blog · 2026年6月12日