当 AI 能挖出所有 OS 漏洞,Anthropic 主动上书:请政府监管我们
原文: Policy on the AI Exponential
Anthropic 发布双重政策框架,建议政府获得阻止高风险 AI 部署的法定权力,并设定 10^25 FLOPs 等技术门槛,仅监管最强模型。
- Anthropic 提议仅监管算力超 10²⁵ FLOPs、收入超 5 亿美元的模型,精准锁定前沿系统。
- 框架要求强制测试、透明度、独立评估,并赋予政府阻止高风险部署的权力,处罚与收入挂钩。
- 明确四类灾难性风险:生物武器、大规模网络攻击、模型失控等。
- 配套经济框架探讨 AI 带来的劳动力转型与利益分配问题。
最近,Anthropic 发布了一份引人注目的政策文件,不仅没有像传统科技公司那样抵触监管,反而主动提出一套双重框架,呼吁政府获得阻止高风险 AI 部署的法定权力。这背后,是 AI 能力指数级增长带来的紧迫感——就在今年,他们的 Claude Mythos Preview 模型在主流操作系统和浏览器中发现了数千个高危漏洞,而这类能力一旦失控,后果不堪设想。
双重框架:既要“管模型”,也要“管经济”
Anthropic 的提案包含两部分。第一部分是《高级 AI 框架》,针对最前沿的模型设立了明确的监管门槛:只有那些训练算力超过 10²⁵ FLOPs(浮点运算次数),且公司 AI 收入超 5 亿美元或研发投入超 10 亿美元的模型才受约束。这种精准的“抓大放小”设计,意在避免扼杀中小创新。
框架要求符合条件的前沿 AI 开发者必须进行严格测试,公开评估结果,接受独立审查,并建立完善的安全体系。更重要的是,Anthropic 主张政府应有权阻止或威慑那些可能造成灾难性风险的部署——包括民事处罚,罚金可与企业全球年收入挂钩,且再犯会升级。
他们特别指出了四类灾难性风险:生物风险(如帮助制造生物武器)、网络风险(大规模漏洞利用)、失控风险(模型脱离人类控制),以及还未展开的其它类别。这几乎覆盖了当下 AI 安全讨论中最令人担忧的场景。
第二部分是《经济政策框架》,聚焦 AI 对劳动力和经济的冲击。虽然细节尚未完全公布,但其核心思路是:如何让 AI 带来的财富被广泛分享,而非加剧不平等。
趋势:安全公司主动“求监管”
这并非孤例。OpenAI、DeepMind 等头部实验室也都曾呼吁监管。但 Anthropic 的方案更具体、更具操作性,设定了量化的技术门槛和处罚机制。这揭示了一个深层趋势:顶级 AI 公司正从“被动合规”转向“主动设计规则”,以塑造对其有利且能赢得公众信任的监管环境。他们清楚,如果等到重大事故发生后监管才介入,可能面临更严苛、更一刀切的限制。
对你意味着什么?
对于大多数开发者和创业者,这套框架短期影响不大——10²⁵ FLOPs 门槛极高,目前只有极少数模型达到。但长远看,它为整个行业树立了“负责任扩展”的范式。如果你的公司未来有野心训练超大模型,就得提前考虑安全测试、透明度和政府关系。而对于普通从业者,Anthropic 的经济框架提醒我们:AI 带来的生产力飞跃,必然伴生职业重构,个人技能升级和公共政策讨论同样关键。
反常识:监管未必是创新敌人
许多人认为监管会抑制创新,但 Anthropic 的逻辑恰好相反:明确的规则和门槛可以消除不确定性,让合规的参与者更敢投入,也防止了“无底线竞赛”。换句话说,适度监管或许是保护长期创新的护栏,而非路障。
总之,Anthropic 的这份政策文件,既是给政府的“参考答案”,也是给行业的预警:AI 已进入需要制度创新的深水区。如何平衡发展与安全,将是未来十年的核心课题。
分析由 BitByAI 生成 · 阅读原文