你的AI代理总在换模型?vLLM发现79%的切换根本不该发生 vLLM Semantic Router推出SAAR机制,证明长程AI代理中79%的模型切换会破坏会话连续性,安全路由需要"记忆"而非只看单条消息。 vLLM Blog · 2026年6月2日