Gemini 3.5 Flash:价格不降反升,谷歌为何敢把它铺满所有产品?
原文: Gemini 3.5 Flash: more expensive, but Google plan to use it for everything
谷歌发布Gemini 3.5 Flash,价格较前代大幅上涨,却同步铺向搜索、Gemini应用等核心产品,揭示AI模型正从单纯追求性价比转向为综合能力付费。
核心要点
- Gemini 3.5 Flash价格大幅上涨,接近Pro模型水平
- 谷歌同步将其部署到搜索、Gemini应用等核心免费产品中
- 新模型支持百万级上下文,但移除了‘计算机使用’功能
- 行业趋势:主要AI实验室都在试探API客户的价格承受能力
深度解读
起因:一次不寻常的涨价与全面铺开
在刚刚结束的Google I/O大会上,谷歌发布了Gemini 3.5 Flash模型。这次发布有两个不寻常之处:第一,它跳过了预览阶段,直接正式发布(GA);第二,也是最引人注目的,它的价格相比前代Flash模型出现了大幅上涨——是Gemini 3 Flash Preview的3倍,是更轻量的3.1 Flash-Lite的6倍。这个价格已经非常接近谷歌自家的Gemini 3.1 Pro模型。
然而,与涨价形成鲜明对比的是,谷歌宣布将把这个更贵的模型铺向其几乎所有关键产品:通过Gemini应用和Google搜索的AI模式面向所有用户,通过Antigravity开发平台和AI Studio面向开发者,以及通过企业平台面向商业客户。这看起来有些矛盾——为什么要把一个更贵的模型大规模用在免费产品上?
拆解:价格背后是能力的重新定位
要理解这一点,我们需要看两个关键变化。首先,从技术参数看,Gemini 3.5 Flash支持高达100万token的输入和6.5万token的输出,上下文窗口巨大。虽然它移除了前代可能有的“计算机使用”(computer use)功能,但在核心的语言理解和生成能力上,它显然被定位为一个更强大的“主力”模型,而不仅仅是一个轻量级、低成本的选择。
其次,谷歌同步推出了新的Interactions API(测试版),这被看作是对标OpenAI Responses API的举措,旨在提供更便捷的服务端历史管理。这表明,谷歌正在将Flash系列从“经济型选择”重新定位为“全能型选手”,试图用一个模型覆盖从简单任务到复杂交互的广泛场景。
趋势洞察:AI模型定价逻辑的转变
这件事揭示了一个更深层的行业趋势:AI模型的定价逻辑正在从“按成本定价”转向“按价值定价”。过去,Flash/Lite这类后缀意味着“便宜、够用”,适合对成本敏感的场景。但现在,谷歌、OpenAI(GPT-5.5比5.4贵一倍)、Anthropic(Claude Opus 4.7比4.6贵)都在提高其主力模型的价格。
这背后的信号是:模型的能力差异正在拉大,而用户(包括企业内部产品团队)愿意为显著提升的能力支付溢价。 当谷歌认为3.5 Flash的能力足以驱动其搜索和Gemini应用的核心AI体验时,即使成本更高,从整体产品价值和用户体验来看也是划算的。这标志着AI模型竞争进入新阶段——不再只是卷价格,更是卷“性价比”的分子,即绝对能力。
实用价值与反常识点
对于开发者和企业而言,这意味着需要重新评估模型选型策略。过去“简单任务用Flash,复杂任务用Pro”的粗略划分可能不再适用。你需要更精细地测试:新Flash模型在你的具体任务上,其能力提升是否值得那3-6倍的成本增加?它是否真的能替代部分Pro模型的工作,从而在整体上优化成本?
一个反常识的点是:免费用户可能最先用上更强大(也更贵)的模型。 谷歌将3.5 Flash直接部署到搜索和Gemini应用中,意味着数十亿用户将无感地享受到模型能力提升带来的体验改善。这背后是科技巨头的商业逻辑:用高昂的API收入(来自开发者)来补贴面向海量消费者的免费服务,以构建产品壁垒和用户习惯。对于开发者来说,这意味着API价格敏感度可能会越来越高,而模型的“能力-成本”比将成为技术选型的核心考量。
总之,Gemini 3.5 Flash的发布不仅仅是一个新模型,它更像是一个风向标,预示着AI行业正从“模型能力军备竞赛”进入“模型价值货币化”的新阶段。
原文地址: Gemini 3.5 Flash: more expensive, but Google plan to use it for everything