### [Anthropic苦心经营最安全AI人设,结果美国政府直接拔了它的插头](https://www.willai.cc/article/1709) **Published:** 2026-06-13T06:30:19 **Author:** hiyoho **Excerpt:** 美国政府本周五给Anthropic发了一道命令:立刻关停Claude Fable 5和Claude Mythos 5两款最强模型的访问权限,理由是哪个外国公民都不能用。Anthropic在X上发了公告,说配合执行,但转头就在官方博客写了一篇 美国政府本周五给Anthropic发了一道命令:立刻关停Claude Fable 5和Claude Mythos 5两款最强模型的访问权限,理由是哪个外国公民都不能用。Anthropic在X上发了公告,说配合执行,但转头就在官方博客写了一篇长文,把政府的逻辑从头到尾怼了一遍。 这件事的讽刺程度相当高。Anthropic过去几个月一直在对外传递一个信号——我们的模型太强了,强到不能随便公开。Mythos 5发布时公司说这东西能识别主流操作系统和浏览器的所有漏洞,所以只敢放进一个叫Project Glasswing的受控项目里,连亚马逊、苹果、谷歌、微软、CrowdStrike这种级别的用户也只给了约50家。结果现在,政府说:既然你承认它危险,那外国人也别用了。然后干脆把全球访问一起掐了。 ![Anthropic CEO Dario Amodei](https://admin.hiyoho.com/wp-content/uploads/2026/06/article1_anthropic.jpg) Anthropic联合创始人兼CEO Dario Amodei(图源:Bloomberg / Getty Images) > “我们发现了一个小范围潜在越狱,就以此为理由召回一款部署给数亿用户的商业模型,我们对此表示反对。如果这一标准被应用于整个行业,我们认为所有前沿模型提供商的模型部署都会实质上被叫停。”——Anthropic官方博客 ### Fable 5才发布3天 被关停的两款模型里,Fable 5其实刚发布没几天。Anthropic给它装了护栏,把网络安全、生物学这些高风险领域的输出拦住,然后觉得可以放心给公众用了。AI基准测试公司Vals AI的数据说,Fable 5是当时公众能用到的最强模型。 政府的理由听起来有点模糊:说是Fable 5有个越狱漏洞。但Anthropic说政府只给了口头证据,那个所谓越狱的实际效果不过是让模型读一段代码然后找漏洞——而且这种能力在GPT-5.5之类的公开模型里也有,网络安全人员天天在用。 Anthropic还补了一刀:我们最底层的安全机制是跑在模型外面的分类器,就算有人真把Fable说服了,让它越过拒绝回答的线,最危险输出的防护还在。政府你到底在担心什么? ### 人设反噬 Anthropic这些年最值钱的东西就是”我们比别家更安全”这个人设。它在AI公司里把自己定位成那个会主动踩刹车的人,投资者买账,用户也买账,IPO前景看起来一片光明。 问题是,你花几个月向全世界宣传”我的AI危险到不能公开部署”,美国政府就会真的来盯你。OpenAI的CEO Sam Altman之前就嘲过这件事,说Anthropic搞的是”基于恐惧的营销”——”我们造了一颗炸弹,本来要扔你头上,现在花1亿美元你可以买个防空洞”,这话术确实好用,但现在看来也有副作用。 Altman当时还没预测到政府会真的来关停模型,但他指出的那个矛盾现在已经兑现了:当你把危险性当成卖点,监管者就会把你当成头等目标。 * * * 这件事对Anthropic的IPO计划显然不是什么好消息。一家公司如果连两款核心模型都被政府一声令下全球关停,投资者会问:下一回会不会是全部?Anthropic说自己反对这个决策,但反对归反对,命令已经执行了。 目前Claude的其他模型访问正常,Fable 5和Mythos 5的访问何时恢复也没有时间表。政府这道命令是以出口管制为框架发的,但执行范围远远超出了”禁止外国人使用”这个名义本身。 📎 原文来源:[Anthropic’s safety warnings may have just backfired — the government has pulled the plug on its most powerful AI | TechCrunch](https://techcrunch.com/2026/06/12/anthropics-safety-warnings-may-have-just-backfired-the-government-has-pulled-the-plug-on-its-most-powerful-ai/) **Tags:** AI, AI安全, AI技术, AI监管, Anthropic, Claude **Categories:** AI资讯 ---