万亿参数模型如何高效同步?Hugging Face 用“差量更新”破局 Hugging Face TRL 库引入差量权重同步技术,通过仅传输模型微小变化(约1-2%),将异步强化学习中的模型同步开销降低两个数量级,使万亿参数模型训练成本大幅下降。 Hugging Face Blog · 2026年5月27日