标签: 模型训练 (4 篇)

IBM Granite 4.1 揭秘：小模型如何通过数据工程挑战巨无霸？

IBM 发布 Granite 4.1 系列模型，其 8B 密集模型通过极致的数据工程和五阶段训练流程，性能竟可匹敌甚至超越上一代 32B 的 MoE 模型，揭示了“数据质量压倒参数规模”的新范式。

Hugging Face Blog · 2026年4月29日

一个仅用1931年前文本训练的13B模型，旨在探索AI在知识边界内的推理、创造与“再发现”能力，并引发了关于数据版权与模型纯净性的新讨论。

Simon Willison · 2026年4月28日

该研究将强化学习环境从逻辑谜题扩展到电商对话，通过8个可算法验证的场景，训练AI代理从“会聊天”到“会办事”。

Hugging Face Blog · 2026年4月16日

TRL v1.0的发布标志着后训练库的重大转变，专为应对快速变化的AI领域而设计，提供稳定性与实验性并存的开发环境。

Hugging Face Blog · 2026年3月31日