EAGLE 3.1:大模型推理加速的“预言家”如何变得更稳健? EAGLE团队联合vLLM和TorchSpec发布EAGLE 3.1,通过解决‘注意力漂移’问题,显著提升了推测解码在长上下文、不同对话模板下的稳健性和接受长度。 vLLM Blog · 2026年5月26日