告别逐字生成:vLLM 原生支持扩散大模型,如何重塑推理范式 vLLM 首次原生支持离散扩散语言模型,通过画布去噪与并行块生成,用算力换带宽,有望打破自回归延迟瓶颈。 vLLM Blog · 2026年6月10日