显存优化 — 标签

不换代码提速近4倍：NVIDIA如何给HuggingFace装上MoE训练加速器

NVIDIA NeMo AutoModel无缝接入HuggingFace生态，仅改一行导入代码即可让MoE模型微调吞吐量提升3.4-3.7倍，显存占用下降约30%。

Hugging Face Blog · 2026年6月25日