IBM Granite 4.1 揭秘:小模型如何通过数据工程挑战巨无霸?
IBM 发布 Granite 4.1 系列模型,其 8B 密集模型通过极致的数据工程和五阶段训练流程,性能竟可匹敌甚至超越上一代 32B 的 MoE 模型,揭示了“数据质量压倒参数规模”的新范式。
Hugging Face Blog · 2026年4月29日
IBM 发布 Granite 4.1 系列模型,其 8B 密集模型通过极致的数据工程和五阶段训练流程,性能竟可匹敌甚至超越上一代 32B 的 MoE 模型,揭示了“数据质量压倒参数规模”的新范式。
一个仅用1931年前文本训练的13B模型,旨在探索AI在知识边界内的推理、创造与“再发现”能力,并引发了关于数据版权与模型纯净性的新讨论。
该研究将强化学习环境从逻辑谜题扩展到电商对话,通过8个可算法验证的场景,训练AI代理从“会聊天”到“会办事”。
TRL v1.0的发布标志着后训练库的重大转变,专为应对快速变化的AI领域而设计,提供稳定性与实验性并存的开发环境。