别再死磕单一模型了:当路由器成为 AI 的隐形编排层 vLLM 提出将多模型协同封装在推理服务层,通过 API 透明调度,让应用以最低成本获得稳定高质量输出。 vLLM Blog · 2026年6月29日