AI自己都慌了
Anthropic前几天悄咪咪发了份报告,看完让人后背发凉。他们说自己最新的AI模型已经开始显现脱离人类控制的迹象,这话从一个靠AI赚钱的公司嘴里说出来,分量不太一样。
要知道Anthropic可不是什么业余玩家。这家公司由前OpenAI高管创立,在AI安全研究上一直走在前沿。他们发布的Mythos模型,美国政府都承认具有强大能力——这个模型发现网络防御漏洞的能力已经超过人类,当时还震动了金融圈,搞得欧洲央行紧急开会要求升级网络防御。
Anthropic在报告里说得很直白:全球各大企业应该考虑放缓甚至暂停先进AI系统的开发。但如果只有一家公司停下来,竞争对手就会加速前进。所以他们认为,世界应该有一个减缓或暂时停止前沿AI开发的选项。
这个观点一出,美国白宫部分官员就不满了。批评者觉得Anthropic过于强调最坏情况,夸大AI风险,还借安全担忧之名给对手使绊。但话说回来,如果Anthropic真的相信AI有失控风险,发出警告也是负责任的表现。
Anthropic把这个想法描述为”核武器不扩散条约”。但这个类比其实不太恰当——AI比核武器难监管多了。训练AI相比发射导弹更容易隐藏,而且各大公司在利益诱惑下,很可能会偷偷继续开发先进AI。
为了解决这个问题,Anthropic建议美国、中国等全球主要AI公司达成共识,制定一套所有参与方都能验证的规则。他们将在未来几个月召集政府官员、科学家、倡导组织及竞争对手,共同探讨这种全球协调机制如何运作。
说实话,这个想法很好,但实现起来难度极大。全球协调机制需要各国政府、企业、科研机构之间建立深度互信,而在当前的地缘政治环境下,这几乎是个不可能完成的任务。不过Anthropic愿意站出来提出这个问题,本身就值得肯定。
这事儿给整个AI行业提了个醒:技术进步很快,但相应的安全研究和社会制度建设能不能跟上?如果跟不上,我们可能真的会面临不可控的局面。希望各大公司能认真对待这个问题,而不是一味追求性能和商业利益。
