DeepSeek V4:用前沿模型几分之一的价格,买到了什么?
原文: DeepSeek V4 - almost on the frontier, a fraction of the price
DeepSeek发布V4系列模型,以极低价格(Pro输入$1.74/M,Flash仅$0.14/M)提供接近前沿的性能,可能重塑开源模型的成本效益标准。
核心要点
- DeepSeek V4发布Pro(1.6T参数)和Flash(284B参数)两个MoE模型,均为百万token上下文,采用MIT开源协议。
- V4 Pro成为当前最大的开源权重模型,参数规模远超Kimi K2.6和GLM-5.1。
- 定价极具颠覆性:Flash输入价格仅为GPT-5.4 Nano的70%,Pro价格仅为GPT-5.4的约三分之一。
- 模型在SVG生成等任务上表现良好,但Pro版在复杂图像生成上出现明显瑕疵,显示其能力与顶级闭源模型仍有差距。
深度解读
起因:为什么现在聊DeepSeek V4? 距离上次V3.2发布不到半年,DeepSeek带着V4系列回归,这本身就传递了一个信号:开源模型的迭代速度正在加快。但更关键的是,它在“价格”这个维度上扔下了一颗炸弹。在GPT-5.5、Claude Opus 4.7等前沿模型每百万token输出价格高达25-30美元的背景下,DeepSeek V4 Pro的输出价格仅为3.48美元,Flash更是低至0.28美元。这不仅仅是“便宜一点”,而是数量级的差异,迫使整个行业重新思考“为智能付费”的成本结构。
拆解:它到底是什么?能力如何? 从架构上看,V4系列是典型的“大力出奇迹”路线。Pro和Flash都是混合专家模型,总参数量巨大(Pro达1.6万亿),但每次推理只激活一部分参数(Pro激活490亿,Flash激活130亿),这是其能在保持高性能的同时控制推理成本的关键。它们都支持100万token的超长上下文,并采用最宽松的MIT开源协议,这意味着任何人都可以自由使用、修改甚至商用,这为生态爆发奠定了基础。
从Simon Willison的实测(生成“鹈鹕骑自行车”的SVG)来看,V4 Flash的表现相当不错,自行车结构合理,鹈鹕形态也基本到位。而更贵的V4 Pro反而在鹈鹕的身体部分出现了明显畸变(身体过大、只有一只翅膀)。这个有趣的例子说明,模型价格与输出质量并非简单的线性关系。更贵的Pro在复杂指令的遵循和细节生成上,可能并不总是优于更便宜的Flash。这提醒开发者,在实际应用中需要针对具体任务进行成本与效果的权衡测试,而不是盲目选择最贵的模型。
趋势洞察:这揭示了什么? DeepSeek V4的发布,标志着“高性价比开源模型”正在成为一个独立且强大的赛道。它揭示了几个深层趋势: 第一,MoE架构已成为平衡性能与成本的工业标准。无论是开源的DeepSeek、Mixtral,还是闭源的Gemini,都在采用MoE。这预示着未来大模型的竞争,将更多地在“如何设计更高效的专家路由和激活策略”上展开。 第二,开源模型的“够用就好”策略正在侵蚀闭源模型的护城河。对于绝大多数企业应用(如客服、文档处理、代码辅助),V4 Flash的性能可能已经完全足够,而其成本优势是压倒性的。这会迫使OpenAI、Anthropic等公司不仅要比拼绝对智能上限,还要在性价比上做出回应。 第三,中国AI实验室在开源模型领域展现出强大的工程化和成本控制能力。DeepSeek、智谱(GLM)、月之暗面(Kimi)等接连推出有竞争力的开源模型,正在全球开源生态中占据越来越重要的位置。这不仅仅是技术竞赛,更是生态和标准的竞赛。
实用价值:跟我有什么关系? 对于开发者和企业技术决策者,V4的出现意味着:
- 重新评估你的AI成本模型。如果你现在的应用大量调用GPT-4级模型,迁移到V4 Pro或Flash可能直接带来一个数量级的成本下降。是时候算一笔账了。
- 开源模型成为严肃的备选项。MIT协议意味着零法律风险,你可以将模型私有化部署,彻底掌控数据隐私和成本。对于金融、医疗等敏感行业,这一点至关重要。
- “混合调用”策略变得更具吸引力。你可以用Flash处理简单、高并发的请求,用Pro处理更复杂的任务,甚至在关键环节仍调用顶级的闭源模型。这种灵活的架构能最大化成本效益。
- 关注其生态和工具链。DeepSeek的API定价虽低,但模型权重是开放的。未来围绕其微调、量化、部署的社区工具和云服务将会涌现,这可能会降低你使用它的总拥有成本。
反常识/意外 一个可能被忽略的点是:如此低的定价是否可持续? 这可能是DeepSeek为了快速获取市场份额和开发者心智而采取的激进策略。对于用户而言,在享受低价红利的同时,也需要考虑供应商的长期稳定性。另一个意外是,正如SVG测试所示,最贵的模型并不总是最好的。这挑战了“一分钱一分货”的简单认知,强调了在实际场景中进行A/B测试和评估的重要性。
原文地址: DeepSeek V4 - almost on the frontier, a fraction of the price