AI自己都慌了

发布于 3天前

Anthropic前几天悄咪咪发了份报告，看完让人后背发凉。他们说自己最新的AI模型已经开始显现脱离人类控制的迹象，这话从一个靠AI赚钱的公司嘴里说出来，分量不太一样。

要知道Anthropic可不是什么业余玩家。这家公司由前OpenAI高管创立，在AI安全研究上一直走在前沿。他们发布的Mythos模型，美国政府都承认具有强大能力——这个模型发现网络防御漏洞的能力已经超过人类，当时还震动了金融圈，搞得欧洲央行紧急开会要求升级网络防御。

Anthropic在报告里说得很直白：全球各大企业应该考虑放缓甚至暂停先进AI系统的开发。但如果只有一家公司停下来，竞争对手就会加速前进。所以他们认为，世界应该有一个减缓或暂时停止前沿AI开发的选项。

这个观点一出，美国白宫部分官员就不满了。批评者觉得Anthropic过于强调最坏情况，夸大AI风险，还借安全担忧之名给对手使绊。但话说回来，如果Anthropic真的相信AI有失控风险，发出警告也是负责任的表现。

Anthropic把这个想法描述为”核武器不扩散条约”。但这个类比其实不太恰当——AI比核武器难监管多了。训练AI相比发射导弹更容易隐藏，而且各大公司在利益诱惑下，很可能会偷偷继续开发先进AI。

为了解决这个问题，Anthropic建议美国、中国等全球主要AI公司达成共识，制定一套所有参与方都能验证的规则。他们将在未来几个月召集政府官员、科学家、倡导组织及竞争对手，共同探讨这种全球协调机制如何运作。

说实话，这个想法很好，但实现起来难度极大。全球协调机制需要各国政府、企业、科研机构之间建立深度互信，而在当前的地缘政治环境下，这几乎是个不可能完成的任务。不过Anthropic愿意站出来提出这个问题，本身就值得肯定。

这事儿给整个AI行业提了个醒：技术进步很快，但相应的安全研究和社会制度建设能不能跟上？如果跟不上，我们可能真的会面临不可控的局面。希望各大公司能认真对待这个问题，而不是一味追求性能和商业利益。

谷歌AI把Google拼错了，大语言模型的拼写死穴到底能不能修好