DeepSeek V4：用前沿模型几分之一的价格，买到了什么？

原文: DeepSeek V4 - almost on the frontier, a fraction of the price

DeepSeek发布V4系列模型，以极低价格（Pro输入$1.74/M，Flash仅$0.14/M）提供接近前沿的性能，可能重塑开源模型的成本效益标准。

大语言模型开源模型成本优化 MoE架构开发者工具

核心要点

DeepSeek V4发布Pro（1.6T参数）和Flash（284B参数）两个MoE模型，均为百万token上下文，采用MIT开源协议。
V4 Pro成为当前最大的开源权重模型，参数规模远超Kimi K2.6和GLM-5.1。
定价极具颠覆性：Flash输入价格仅为GPT-5.4 Nano的70%，Pro价格仅为GPT-5.4的约三分之一。
模型在SVG生成等任务上表现良好，但Pro版在复杂图像生成上出现明显瑕疵，显示其能力与顶级闭源模型仍有差距。

深度解读

起因：为什么现在聊DeepSeek V4？ 距离上次V3.2发布不到半年，DeepSeek带着V4系列回归，这本身就传递了一个信号：开源模型的迭代速度正在加快。但更关键的是，它在“价格”这个维度上扔下了一颗炸弹。在GPT-5.5、Claude Opus 4.7等前沿模型每百万token输出价格高达25-30美元的背景下，DeepSeek V4 Pro的输出价格仅为3.48美元，Flash更是低至0.28美元。这不仅仅是“便宜一点”，而是数量级的差异，迫使整个行业重新思考“为智能付费”的成本结构。

拆解：它到底是什么？能力如何？ 从架构上看，V4系列是典型的“大力出奇迹”路线。Pro和Flash都是混合专家模型，总参数量巨大（Pro达1.6万亿），但每次推理只激活一部分参数（Pro激活490亿，Flash激活130亿），这是其能在保持高性能的同时控制推理成本的关键。它们都支持100万token的超长上下文，并采用最宽松的MIT开源协议，这意味着任何人都可以自由使用、修改甚至商用，这为生态爆发奠定了基础。

从Simon Willison的实测（生成“鹈鹕骑自行车”的SVG）来看，V4 Flash的表现相当不错，自行车结构合理，鹈鹕形态也基本到位。而更贵的V4 Pro反而在鹈鹕的身体部分出现了明显畸变（身体过大、只有一只翅膀）。这个有趣的例子说明，模型价格与输出质量并非简单的线性关系。更贵的Pro在复杂指令的遵循和细节生成上，可能并不总是优于更便宜的Flash。这提醒开发者，在实际应用中需要针对具体任务进行成本与效果的权衡测试，而不是盲目选择最贵的模型。

趋势洞察：这揭示了什么？ DeepSeek V4的发布，标志着“高性价比开源模型”正在成为一个独立且强大的赛道。它揭示了几个深层趋势：第一，MoE架构已成为平衡性能与成本的工业标准。无论是开源的DeepSeek、Mixtral，还是闭源的Gemini，都在采用MoE。这预示着未来大模型的竞争，将更多地在“如何设计更高效的专家路由和激活策略”上展开。第二，开源模型的“够用就好”策略正在侵蚀闭源模型的护城河。对于绝大多数企业应用（如客服、文档处理、代码辅助），V4 Flash的性能可能已经完全足够，而其成本优势是压倒性的。这会迫使OpenAI、Anthropic等公司不仅要比拼绝对智能上限，还要在性价比上做出回应。第三，中国AI实验室在开源模型领域展现出强大的工程化和成本控制能力。DeepSeek、智谱（GLM）、月之暗面（Kimi）等接连推出有竞争力的开源模型，正在全球开源生态中占据越来越重要的位置。这不仅仅是技术竞赛，更是生态和标准的竞赛。

实用价值：跟我有什么关系？ 对于开发者和企业技术决策者，V4的出现意味着：

重新评估你的AI成本模型。如果你现在的应用大量调用GPT-4级模型，迁移到V4 Pro或Flash可能直接带来一个数量级的成本下降。是时候算一笔账了。
开源模型成为严肃的备选项。MIT协议意味着零法律风险，你可以将模型私有化部署，彻底掌控数据隐私和成本。对于金融、医疗等敏感行业，这一点至关重要。
“混合调用”策略变得更具吸引力。你可以用Flash处理简单、高并发的请求，用Pro处理更复杂的任务，甚至在关键环节仍调用顶级的闭源模型。这种灵活的架构能最大化成本效益。
关注其生态和工具链。DeepSeek的API定价虽低，但模型权重是开放的。未来围绕其微调、量化、部署的社区工具和云服务将会涌现，这可能会降低你使用它的总拥有成本。

反常识/意外 一个可能被忽略的点是：如此低的定价是否可持续？ 这可能是DeepSeek为了快速获取市场份额和开发者心智而采取的激进策略。对于用户而言，在享受低价红利的同时，也需要考虑供应商的长期稳定性。另一个意外是，正如SVG测试所示，最贵的模型并不总是最好的。这挑战了“一分钱一分货”的简单认知，强调了在实际场景中进行A/B测试和评估的重要性。

原文地址: DeepSeek V4 - almost on the frontier, a fraction of the price

分析由 BitByAI 生成 · 阅读原文

原文来自 Simon Willison · 由 BitByAI 自动解读