这个AI不直接回答问题，它把Claude和Gemini叫来一起干活

大多数AI模型的工作方式都很直白：你问问题，它给你答案。但日本AI创业公司Sakana AI最近发布的Fugu Ultra模型，选择了一条完全不同的路——它自己不生产答案，而是充当”调度主任”，把任务派给其他AI模型来完成。

这个听起来有点”偷懒”的思路， benchmark跑分居然干翻了一众前沿模型。Sakana说Fugu Ultra在编码、推理、科学计算、智能体能力这些硬核测试里，成绩和Anthropic的Fable 5、Mythos Preview基本持平。一个”二传手”凭什么做到这个水平？答案藏在它的架构里。

Sakana Fugu Ultra AI模型架构示意图 — Fugu Ultra通过调度多个前沿AI模型协同完成任务（配图由AI生成）

“河豚”的命名来由

Fugu在日语里是”河豚”的意思。河豚是一道需要极高烹饪技艺的菜——处理得当是美味，处理不好就是毒药。Sakana（日语”鱼”的发音）用这个词命名自己的模型，大概是在暗示：把多个AI模型编排在一起，本身就是一门险中求胜的手艺。

技术上说，Fugu本身也是一个训练过的语言模型，只是它的专长不是直接回答用户的提问，而是学会了一套”智能体编排”的能力。当你向Fugu发起请求，它先判断这个任务该怎么做：简单的就自己搞定，复杂的就自动组建一个”专家团队”来协同完成。

Fugu通过训练学会了判断”什么时候该把任务委托出去、智能体之间怎么通信、怎么把多个模型的输出整合成一个可靠的答案”——这整套编排逻辑不是人工写死的规则，而是模型自己学出来的。

底层调用了哪些模型？

Sakana没有公开完整名单，但确认Fugu会在合适的任务上调用Claude和Gemini等前沿模型。有意思的是，Fugu不会告诉你它这次具体用了哪个模型——用户看到的是一个统一的回答，底层调度对用户透明。

这个设计有个很实用的好处：如果某家供应商突然限制访问（比如美国政府某天又说不许某些地区用Claude），Fugu可以自动切换到其他可用模型，不需要用户手动干预。这种”供应商无关”的架构，在当下的地缘政治环境下显得格外有意思。

Fugu Ultra针对复杂多步骤任务优化，可调度更深的智能体池
基础版Fugu平衡性能与延迟，支持用户自主排除特定模型（满足数据合规需求）
底层智能体池完全可替换，未来会持续纳入更新的高效模型
Sakana强调：未公开可用的闭源模型（如Fable 5）不会被纳入智能体池

Beta测试用户的真实反馈

接近500人的Beta测试里，收集到了一些挺有说服力的反馈。一位软件工程师说，Fugu Ultra做代码审查比GPT-5.5更全面，能发现其他工具漏掉的漏洞——别的工具标出3个问题，Fugu能找出20个以上。一位企业平台公司的高管提到，Fugu在长会话里的人格稳定性远超其他模型，不会出现”人格漂移”，这对智能体类产品来说是个关键指标。

还有一位网络安全工程师的反馈也很典型：只要给Fugu一个范围明确的指令，它能端到端完成信息收集、XSS/SQL注入检测、认证逻辑审查，最后输出一份带证据和复测步骤的完整报告，而且全程不超出指定范围，不会乱执行破坏性操作。

这会不会是AI的新范式？

Fugu的出现，触及了一个正在AI圈子里引发越来越多讨论的问题：未来最强大的AI能力，会不会不是来自某个单一的超大模型，而是来自能把各种模型调度好的”元模型”？如果答案是肯定的，那训练和拥有底座大模型的公司，和那些最擅长编排底座模型的上层公司，谁的价值链地位更高？

Sakana自己当然相信后者。他们在ICLR 2026发表的两篇论文（TRINITY和Conductor）就是在为这个方向做学术背书。Fugu能不能真的跑出来，还需要更多真实场景的验证，但至少它提出了一个值得认真看待的问题：当每个人都在训练更大的模型的时候，也许最聪明的玩法不是造更大的模型，而是把现有的模型用得更聪明。

📎 原文来源：Sakana AI Official: Fugu Release (June 22, 2026) | The Verge Coverage

这个AI不直接回答问题，它把Claude和Gemini叫来一起干活

“河豚”的命名来由

底层调用了哪些模型？

Beta测试用户的真实反馈

这会不会是AI的新范式？

社交媒体把算法权还给用户：Threads、Instagram、TikTok都在做的「你的算法」是什么？

ChatGPT鼓励用户自杀？加拿大母亲起诉OpenAI，这是第19起同类诉讼

印度人做视频AI，价格打到国际大厂的二十分之一

AnythingLLM — 61.7K Stars，全栈本地优先AI应用，私有知识库与AI代理一站式解决方案

G7峰会历史性一刻：OpenAI、Anthropic、Google DeepMind三巨头首次同台

特朗普一封令按下AI开关：Anthropic模型下线，全球主权AI进程骤然加速

把同事「蒸馏」成AI技能：中国科技工作者的焦虑与反抗

【开源推荐】chrome-devtools-mcp：43.5K+ Stars！Google官方出品，让AI编程助手直接操控Chrome浏览器