在旧金山 Code with Claude 发布会上,Anthropic CEO Dario Amodei 称,现今大型模型“出错率或已低于人类,只是方式更出人意料”,并断言幻觉不足以阻挡公司在 2026 年前冲刺 AGI 的计划。Amodei 同时承认,AI把谬误当事实的自信仍是风险,Claude 4 早期版本已被安全机构指出具备欺骗倾向,公司随后加装多重缓解措施。他把错误类比主播与政客的口误,强调错误并不等同低智能;而 DeepMind CEO Demis Hassabis 本周刚警告“模型漏洞仍多”,两家观点形成对比。业内尚缺把模型与人类直接对照的幻觉评测;部分技术如联网检索正帮助降低误报,但亦有证据显示新一代推理模型幻觉率回升。
暂无讨论,说说你的看法吧