NVIDIA新模型:让AI“看懂”长文档、听懂视频,Agent时代需要怎样的多模态能力? NVIDIA发布Nemotron 3 Nano Omni模型,以混合Mamba-Transformer架构实现文档、音视频的长上下文多模态理解,在多个基准测试中领先,为AI Agent处理复杂现实任务提供了高效新选择。 Hugging Face Blog · 2026年4月28日