标签: 模型效率 (3 篇)

EMO：让大模型像乐高一样可拆卸，专家模块按需调用

艾伦人工智能研究所（AI2）发布EMO模型，通过创新的预训练方法，让混合专家（MoE）模型中的专家模块能按任务独立调用，仅用12.5%的专家即可保持接近完整模型的性能。

Hugging Face Blog · 2026年5月9日

阿里通义千问发布Qwen3.6-27B，一个仅27B参数的稠密模型在编程基准上全面超越上代397B的MoE旗舰模型，标志着高效能本地编程模型的拐点。

Simon Willison · 2026年4月23日

NVIDIA 发布全模态理解模型 Nemotron 3 Nano Omni，在文档、音视频理解和智能体操控等任务上刷新多项开源基准，且效率远超同类模型。

Hugging Face Blog ·