当强化学习遇上多模态生成:VeRL-Omni 如何让 Diffusion 模型学会“自我进化”? VeRL-Omni 是一个专为多模态生成模型设计的强化学习训练框架,它解决了在扩散模型和全模态模型上进行高效、稳定RL训练的工程难题,将LLM的RL训练范式扩展到了图像、视频、音频生成领域。 vLLM Blog · 2026年5月14日