NVIDIA发布全模态小模型,Agent效率提升9倍的秘密武器 NVIDIA发布开源全模态模型Nemotron 3 Nano Omni,通过混合专家架构将30B参数模型的激活参数降至3B,实现比同类模型高9倍的吞吐量,旨在解决多模态AI Agent的效率和碎片化问题。 vLLM Blog · 2026年4月28日