当 AI 能挖出所有 OS 漏洞，Anthropic 主动上书：请政府监管我们

Anthropic 发布双重政策框架，建议政府获得阻止高风险 AI 部署的法定权力，并设定 10^25 FLOPs 等技术门槛，仅监管最强模型。

核心要点

Anthropic 提议仅监管算力超 10²⁵ FLOPs、收入超 5 亿美元的模型，精准锁定前沿系统。
框架要求强制测试、透明度、独立评估，并赋予政府阻止高风险部署的权力，处罚与收入挂钩。
明确四类灾难性风险：生物武器、大规模网络攻击、模型失控等。
配套经济框架探讨 AI 带来的劳动力转型与利益分配问题。

深度解读

最近，Anthropic 发布了一份引人注目的政策文件，不仅没有像传统科技公司那样抵触监管，反而主动提出一套双重框架，呼吁政府获得阻止高风险 AI 部署的法定权力。这背后，是 AI 能力指数级增长带来的紧迫感——就在今年，他们的 Claude Mythos Preview 模型在主流操作系统和浏览器中发现了数千个高危漏洞，而这类能力一旦失控，后果不堪设想。

双重框架：既要“管模型”，也要“管经济”

Anthropic 的提案包含两部分。第一部分是《高级 AI 框架》，针对最前沿的模型设立了明确的监管门槛：只有那些训练算力超过 10²⁵ FLOPs（浮点运算次数），且公司 AI 收入超 5 亿美元或研发投入超 10 亿美元的模型才受约束。这种精准的“抓大放小”设计，意在避免扼杀中小创新。

框架要求符合条件的前沿 AI 开发者必须进行严格测试，公开评估结果，接受独立审查，并建立完善的安全体系。更重要的是，Anthropic 主张政府应有权阻止或威慑那些可能造成灾难性风险的部署——包括民事处罚，罚金可与企业全球年收入挂钩，且再犯会升级。

他们特别指出了四类灾难性风险：生物风险（如帮助制造生物武器）、网络风险（大规模漏洞利用）、失控风险（模型脱离人类控制），以及还未展开的其它类别。这几乎覆盖了当下 AI 安全讨论中最令人担忧的场景。

第二部分是《经济政策框架》，聚焦 AI 对劳动力和经济的冲击。虽然细节尚未完全公布，但其核心思路是：如何让 AI 带来的财富被广泛分享，而非加剧不平等。

趋势：安全公司主动“求监管”

这并非孤例。OpenAI、DeepMind 等头部实验室也都曾呼吁监管。但 Anthropic 的方案更具体、更具操作性，设定了量化的技术门槛和处罚机制。这揭示了一个深层趋势：顶级 AI 公司正从“被动合规”转向“主动设计规则”，以塑造对其有利且能赢得公众信任的监管环境。他们清楚，如果等到重大事故发生后监管才介入，可能面临更严苛、更一刀切的限制。

对你意味着什么？

对于大多数开发者和创业者，这套框架短期影响不大——10²⁵ FLOPs 门槛极高，目前只有极少数模型达到。但长远看，它为整个行业树立了“负责任扩展”的范式。如果你的公司未来有野心训练超大模型，就得提前考虑安全测试、透明度和政府关系。而对于普通从业者，Anthropic 的经济框架提醒我们：AI 带来的生产力飞跃，必然伴生职业重构，个人技能升级和公共政策讨论同样关键。

反常识：监管未必是创新敌人

许多人认为监管会抑制创新，但 Anthropic 的逻辑恰好相反：明确的规则和门槛可以消除不确定性，让合规的参与者更敢投入，也防止了“无底线竞赛”。换句话说，适度监管或许是保护长期创新的护栏，而非路障。

总之，Anthropic 的这份政策文件，既是给政府的“参考答案”，也是给行业的预警：AI 已进入需要制度创新的深水区。如何平衡发展与安全，将是未来十年的核心课题。

原文地址: Policy on the AI Exponential

分析由 BitByAI 生成 · 阅读原文

原文来自 Anthropic News · 由 BitByAI 自动解读