暂无菜单项

76名网络安全专家联名抗议:美国政府封禁Anthropic最强模型,是在削弱防御

发布于
2

上周,美国政府对Anthropic的Fable和Mythos模型下达了出口管制令,理由是国家安全。Anthropic随即暂停了全球用户对这两款模型的访问。

事情到这里,看起来又是一个AI监管收紧的故事。但接下来的发展有点出人意料——76名网络安全专家联名写了一封公开信,要求政府撤销这道命令。

网络安全AI概念图
网络安全专家联名抗议Anthropic模型出口管制令

联署名单相当豪华

这份公开信的签署者里有不少业内重量级人物:前Facebook首席安全官Alex Stamos、漏洞赏金平台Bugcrowd创始人Casey Ellis、著名密码学家兼前苹果安全设计经理Jon Callas、计算机科学家Paul Vixie、前Block应用安全工程负责人Dino Dai Zovi、Luta Security创始人Katie Moussouris,以及安全意识培训公司SocialProof Security的CEO Rachel Tobac。

他们在信里说得很直接:把最好的模型从网络安全防御者手里拿走,而没有充分的理由,这是”危险的”。

“当我们的对手在快速进步的时候,把最好的能力从防御者那里拿走,是没有充分理由的危险行为。”

禁令到底是怎么来的

Anthropic今年4月推出Mythos预览版时,声称这个模型找安全漏洞的能力太强,所以需要严格限制访问,防止恶意黑客或外国对手拿来在互联网上搞破坏。实际操作里,Anthropic只给了大约50家公司初始访问权限,最近才扩展到15个国家的约150个组织。

6月9日,Anthropic发布了Fable,这是Mythos的公开版本,但加了严格的护栏,阻止它在生物、化学和网络安全领域的使用,同时也防止别人通过”蒸馏”来复制这个模型。

问题是,Fable的护栏严格到了许多网络安全专家发现它基本拦掉了任何与网络安全相关的提示词。

亚马逊的论文:是真越狱还是误报

据信,白宫的出口管制令可能源于一份亚马逊研究人员的论文,论文展示了一个可以绕过Fable护栏、解锁其Mythos级别能力的方法。

但联署人之一Katie Moussouris在审阅了这份尚未公开的论文后,给出了完全不同的判断:这根本不是真正的越狱。

她写道,研究人员只是让Fable去修复含有”故意植入的漏洞”的开源代码——而这正是模型最初拒绝”审查代码安全问题”之后发生的事情。

“论文里描述的行为没办法被真正修复,任何尝试都只会削弱模型用于防御的能力。”Moussouris写道,”防御者需要能够要求AI修复文件里的bug、解释修复为什么重要、以及编写确认补丁有效的测试。这不是护栏绕过,这是AI模型能为防御性安全做的最有价值的事情:执行防御者每天都在跑的’发现、修复、测试’循环。”

专家们真正担心的是什么

公开信里还指出,亚马逊论文里描述的方法,在OpenAI的GPT-5.5上、在Anthropic自己公开可用的Claude Opus 4.8和Sonnet上、”甚至在中国的Kimi 2.7这样的模型上”都能复现。

也就是说,封掉Fable和Mythos,并没有真正消除这个所谓的”漏洞”——它只是让美国自己的防御者用不上好工具,而对手那边照样能用上类似的能力。

专家们的要求很明确:他们想要的是由”民主的规则制定程序”产生、基于产业和学术专家科学研究、透明且公平执行的监管,并且”只以最低必要程度使用,以确保美国公众的安全”。

0 点赞
0 收藏
分享
0 讨论
反馈
0 讨论
热门最新
总结
暂无总结
0 / 600
嗨,下午好!
所有的成功,都源自一个勇敢的开始
聊天室

登录后参与聊天