暂无菜单项

这个AI不直接回答问题,它把Claude和Gemini叫来一起干活

发布于
1

大多数AI模型的工作方式都很直白:你问问题,它给你答案。但日本AI创业公司Sakana AI最近发布的Fugu Ultra模型,选择了一条完全不同的路——它自己不生产答案,而是充当”调度主任”,把任务派给其他AI模型来完成。

这个听起来有点”偷懒”的思路, benchmark跑分居然干翻了一众前沿模型。Sakana说Fugu Ultra在编码、推理、科学计算、智能体能力这些硬核测试里,成绩和Anthropic的Fable 5、Mythos Preview基本持平。一个”二传手”凭什么做到这个水平?答案藏在它的架构里。

Sakana Fugu Ultra AI模型架构示意图
Fugu Ultra通过调度多个前沿AI模型协同完成任务(配图由AI生成)

“河豚”的命名来由

Fugu在日语里是”河豚”的意思。河豚是一道需要极高烹饪技艺的菜——处理得当是美味,处理不好就是毒药。Sakana(日语”鱼”的发音)用这个词命名自己的模型,大概是在暗示:把多个AI模型编排在一起,本身就是一门险中求胜的手艺。

技术上说,Fugu本身也是一个训练过的语言模型,只是它的专长不是直接回答用户的提问,而是学会了一套”智能体编排”的能力。当你向Fugu发起请求,它先判断这个任务该怎么做:简单的就自己搞定,复杂的就自动组建一个”专家团队”来协同完成。

Fugu通过训练学会了判断”什么时候该把任务委托出去、智能体之间怎么通信、怎么把多个模型的输出整合成一个可靠的答案”——这整套编排逻辑不是人工写死的规则,而是模型自己学出来的。

底层调用了哪些模型?

Sakana没有公开完整名单,但确认Fugu会在合适的任务上调用Claude和Gemini等前沿模型。有意思的是,Fugu不会告诉你它这次具体用了哪个模型——用户看到的是一个统一的回答,底层调度对用户透明。

这个设计有个很实用的好处:如果某家供应商突然限制访问(比如美国政府某天又说不许某些地区用Claude),Fugu可以自动切换到其他可用模型,不需要用户手动干预。这种”供应商无关”的架构,在当下的地缘政治环境下显得格外有意思。

  • Fugu Ultra针对复杂多步骤任务优化,可调度更深的智能体池
  • 基础版Fugu平衡性能与延迟,支持用户自主排除特定模型(满足数据合规需求)
  • 底层智能体池完全可替换,未来会持续纳入更新的高效模型
  • Sakana强调:未公开可用的闭源模型(如Fable 5)不会被纳入智能体池

Beta测试用户的真实反馈

接近500人的Beta测试里,收集到了一些挺有说服力的反馈。一位软件工程师说,Fugu Ultra做代码审查比GPT-5.5更全面,能发现其他工具漏掉的漏洞——别的工具标出3个问题,Fugu能找出20个以上。一位企业平台公司的高管提到,Fugu在长会话里的人格稳定性远超其他模型,不会出现”人格漂移”,这对智能体类产品来说是个关键指标。

还有一位网络安全工程师的反馈也很典型:只要给Fugu一个范围明确的指令,它能端到端完成信息收集、XSS/SQL注入检测、认证逻辑审查,最后输出一份带证据和复测步骤的完整报告,而且全程不超出指定范围,不会乱执行破坏性操作。

这会不会是AI的新范式?

Fugu的出现,触及了一个正在AI圈子里引发越来越多讨论的问题:未来最强大的AI能力,会不会不是来自某个单一的超大模型,而是来自能把各种模型调度好的”元模型”?如果答案是肯定的,那训练和拥有底座大模型的公司,和那些最擅长编排底座模型的上层公司,谁的价值链地位更高?

Sakana自己当然相信后者。他们在ICLR 2026发表的两篇论文(TRINITY和Conductor)就是在为这个方向做学术背书。Fugu能不能真的跑出来,还需要更多真实场景的验证,但至少它提出了一个值得认真看待的问题:当每个人都在训练更大的模型的时候,也许最聪明的玩法不是造更大的模型,而是把现有的模型用得更聪明。


0 点赞
0 收藏
分享
0 讨论
反馈
0 讨论
热门最新
总结
暂无总结
0 / 600