← 返回首页

标签: 分布式系统 (2 篇)

万亿参数模型如何高效同步？Hugging Face 用“差量更新”破局

Hugging Face TRL 库引入差量权重同步技术，通过仅传输模型微小变化（约1-2%），将异步强化学习中的模型同步开销降低两个数量级，使万亿参数模型训练成本大幅下降。

Hugging Face Blog · 2026年5月27日

当AI学会“长跑”：vLLM与Mooncake如何让智能体服务成本暴降

vLLM集成Mooncake分布式KV缓存，解决智能体工作负载中重复计算长上下文前缀的瓶颈，实现吞吐量提升3.8倍、首字延迟降低46倍的显著性能飞跃。

vLLM Blog ·