← 返回首页

标签: 长上下文 (2 篇)

百万上下文不是终点：GLM-5.2 如何让长链任务真正可用？

智谱发布 GLM-5.2，首次在开源模型上实现稳定 1M 上下文，并在多个长链编码基准上媲美闭源顶级模型。

Hugging Face Blog · 2026年6月17日

百万Token长文本时代来临：DeepSeek V4的高效注意力机制全解读

DeepSeek V4通过创新的KV缓存压缩和稀疏注意力机制，在vLLM上实现了百万Token超长上下文的高效推理，标志着长文本处理进入新阶段。

vLLM Blog ·