vLLM 内置强化学习 API:告别“手搓”权重同步,让大模型在线学习更简单 vLLM 推出原生强化学习 API,通过标准化权重同步和异步训练支持,解决了大模型在线强化学习中框架碎片化和部署脆弱的核心痛点。 vLLM Blog · 2026年5月28日