### [Anthropic苦心经营最安全AI人设，结果美国政府直接拔了它的插头](https://www.willai.cc/article/1709)

**Published:** 2026-06-13T06:30:19

**Author:** hiyoho

**Excerpt:** 美国政府本周五给Anthropic发了一道命令：立刻关停Claude Fable 5和Claude Mythos 5两款最强模型的访问权限，理由是哪个外国公民都不能用。Anthropic在X上发了公告，说配合执行，但转头就在官方博客写了一篇

美国政府本周五给Anthropic发了一道命令：立刻关停Claude Fable 5和Claude Mythos 5两款最强模型的访问权限，理由是哪个外国公民都不能用。Anthropic在X上发了公告，说配合执行，但转头就在官方博客写了一篇长文，把政府的逻辑从头到尾怼了一遍。

这件事的讽刺程度相当高。Anthropic过去几个月一直在对外传递一个信号——我们的模型太强了，强到不能随便公开。Mythos 5发布时公司说这东西能识别主流操作系统和浏览器的所有漏洞，所以只敢放进一个叫Project Glasswing的受控项目里，连亚马逊、苹果、谷歌、微软、CrowdStrike这种级别的用户也只给了约50家。结果现在，政府说：既然你承认它危险，那外国人也别用了。然后干脆把全球访问一起掐了。

![Anthropic CEO Dario Amodei](https://admin.hiyoho.com/wp-content/uploads/2026/06/article1_anthropic.jpg)

Anthropic联合创始人兼CEO Dario Amodei（图源：Bloomberg / Getty Images）

> “我们发现了一个小范围潜在越狱，就以此为理由召回一款部署给数亿用户的商业模型，我们对此表示反对。如果这一标准被应用于整个行业，我们认为所有前沿模型提供商的模型部署都会实质上被叫停。”——Anthropic官方博客

### Fable 5才发布3天

被关停的两款模型里，Fable 5其实刚发布没几天。Anthropic给它装了护栏，把网络安全、生物学这些高风险领域的输出拦住，然后觉得可以放心给公众用了。AI基准测试公司Vals AI的数据说，Fable 5是当时公众能用到的最强模型。

政府的理由听起来有点模糊：说是Fable 5有个越狱漏洞。但Anthropic说政府只给了口头证据，那个所谓越狱的实际效果不过是让模型读一段代码然后找漏洞——而且这种能力在GPT-5.5之类的公开模型里也有，网络安全人员天天在用。

Anthropic还补了一刀：我们最底层的安全机制是跑在模型外面的分类器，就算有人真把Fable说服了，让它越过拒绝回答的线，最危险输出的防护还在。政府你到底在担心什么？

### 人设反噬

Anthropic这些年最值钱的东西就是”我们比别家更安全”这个人设。它在AI公司里把自己定位成那个会主动踩刹车的人，投资者买账，用户也买账，IPO前景看起来一片光明。

问题是，你花几个月向全世界宣传”我的AI危险到不能公开部署”，美国政府就会真的来盯你。OpenAI的CEO Sam Altman之前就嘲过这件事，说Anthropic搞的是”基于恐惧的营销”——”我们造了一颗炸弹，本来要扔你头上，现在花1亿美元你可以买个防空洞”，这话术确实好用，但现在看来也有副作用。

Altman当时还没预测到政府会真的来关停模型，但他指出的那个矛盾现在已经兑现了：当你把危险性当成卖点，监管者就会把你当成头等目标。

* * *

这件事对Anthropic的IPO计划显然不是什么好消息。一家公司如果连两款核心模型都被政府一声令下全球关停，投资者会问：下一回会不会是全部？Anthropic说自己反对这个决策，但反对归反对，命令已经执行了。

目前Claude的其他模型访问正常，Fable 5和Mythos 5的访问何时恢复也没有时间表。政府这道命令是以出口管制为框架发的，但执行范围远远超出了”禁止外国人使用”这个名义本身。

📎 原文来源：[Anthropic’s safety warnings may have just backfired — the government has pulled the plug on its most powerful AI | TechCrunch](https://techcrunch.com/2026/06/12/anthropics-safety-warnings-may-have-just-backfired-the-government-has-pulled-the-plug-on-its-most-powerful-ai/)

**Tags:** AI, AI安全, AI技术, AI监管, Anthropic, Claude

**Categories:** AI资讯

---