为什么语音合成推理不能照搬大模型经验?vLLM 的异构流水线启示 TTS推理并非单步自回归,而是延迟敏感与吞吐敏感模块的异构流水线,传统大模型优化套路在此失效,需架构感知的定制调度。 vLLM Blog · 2026年6月23日