EMO:让大模型像乐高一样可拆卸,专家模块按需调用
艾伦人工智能研究所(AI2)发布EMO模型,通过创新的预训练方法,让混合专家(MoE)模型中的专家模块能按任务独立调用,仅用12.5%的专家即可保持接近完整模型的性能。
Hugging Face Blog · 2026年5月9日
艾伦人工智能研究所(AI2)发布EMO模型,通过创新的预训练方法,让混合专家(MoE)模型中的专家模块能按任务独立调用,仅用12.5%的专家即可保持接近完整模型的性能。
阿里通义千问发布Qwen3.6-27B,一个仅27B参数的稠密模型在编程基准上全面超越上代397B的MoE旗舰模型,标志着高效能本地编程模型的拐点。
NVIDIA 发布全模态理解模型 Nemotron 3 Nano Omni,在文档、音视频理解和智能体操控等任务上刷新多项开源基准,且效率远超同类模型。