Sakana Fugu 是什麼?日本多代理 AI 模型登場,單一 API 協調 GPT、Claude、Gemini
日本東京 AI 新創公司 Sakana AI 於 2026 年 6 月 22 日正式推出全新 AI 產品 Sakana Fugu 🐡,這是一套以「多代理協調(Multi-Agent Orchestration)」為核心的基礎模型系統。簡單來說,Sakana Fugu 不是一個傳統的單一語言模型,而是一個會動態調度 GPT-5.5、Claude Opus、Gemini 3.1 Pro 等頂尖 AI 模型的「指揮家」,讓多個 AI 模型分工合作,完成更複雜的任務。
誰是 Sakana AI?從 Google Transformer 作者創辦的日本 AI 實驗室
Sakana AI 成立於 2023 年,由前 Google Brain 研究員 David Ha 與 Llion Jones 共同創辦,其中 Llion Jones 是 AI 史上最重要論文之一「Attention Is All You Need」(2017)的共同作者。公司名稱「Sakana」在日語中意為「魚」,代表其仿效自然生態、透過群體協作發揮集體智慧的核心理念。
公司在 2024 年完成 A 輪融資,獲得三菱UFJ、瑞穗、KDDI、NVIDIA 等日本及矽谷重量級企業投資,估值達約 26 億美元。

Sakana Fugu 的技術核心:兩篇 ICLR 2026 論文
Sakana Fugu 的底層技術建立在兩篇被 ICLR 2026 國際頂尖 AI 學術會議收錄的研究上:
- TRINITY:演化式 LLM 協調器,將不同 AI 模型分配為「Thinker(思考者)」、「Worker(執行者)」、「Verifier(驗證者)」三種角色,依任務動態分工
- Conductor(RL 指揮家):以強化學習訓練一個 7B 參數的小模型,自主學習如何用自然語言協調多個大型 AI,不靠人工設計流程
這套系統最神奇的地方在於:用一個 70 億參數的小模型「管理」GPT-5 或 Claude,卻能超越它們的單獨表現——靠的是「分工」而非「暴力提升算力」。

Fugu vs Fugu Ultra:兩款版本比較
Sakana Fugu 提供兩種版本:
| 版本 | 定位 | 適合使用場景 |
|---|---|---|
| Fugu | 平衡速度與品質 | 程式碼審查、聊天機器人、日常開發工作 |
| Fugu Ultra | 最高品質優先 | Kaggle 競賽、論文重現、資安分析、專利調查、科研任務 |
兩款版本皆可透過同一 OpenAI 相容 API 呼叫,用戶可按需切換,無需更改程式整合。
基準測試成績:超越多數主流 AI 模型
根據 Sakana AI 官方公布的數據,Fugu Ultra 在多項關鍵基準測試中超越 Claude Opus 4.8、Gemini 3.1 Pro 及 GPT-5.5:
| 基準測試 | Fugu Ultra | Fugu | Claude Opus 4.8 | Gemini 3.1 Pro | GPT-5.5 |
|---|---|---|---|---|---|
| SWE Bench Pro(軟體工程) | 73.7 | 59.0 | 69.2 | 54.2 | 58.6 |
| LiveCodeBench(程式碼) | 93.2 | 92.9 | 87.8 | 88.5 | 85.3 |
| GPQA-D(研究所科學) | 95.5 | 95.5 | 92.0 | 94.3 | 93.6 |
| Humanity's Last Exam | 50.0 | 47.2 | 49.8 | 44.4 | 41.4 |
| TerminalBench 2.1 | 82.1 | 80.2 | 74.6 | 70.3 | 78.2 |
值得注意的是,Fugu 的測試中並未包含 Anthropic 的 Fable 5 與 Mythos Preview(因這兩款模型尚未公開),但 Sakana AI 表示其表現與這兩款頂尖模型「並駕齊驅」。
實際應用案例:AI 自主研究、魔方求解、目盲下棋
Sakana AI 公布了多個令人印象深刻的實際測試案例:
- 🤖 AutoResearch:Fugu Ultra 在單一 H100 GPU 上自主執行 123 次實驗、歷時 14 小時,完成小型語言模型訓練優化,成績優於所有對手
- 🧊 魔方求解:給定同一個打亂的魔方,Fugu Ultra 以 19 步完成,優於 GPT-5.5 的 21 步
- ♟️ 目盲西洋棋:Fugu 在不顯示棋盤的情況下,連勝 GPT-5.5、Claude Opus 4.8、Gemini 3.1 Pro 以及 2100 ELO 的 Stockfish 引擎
- 📋 專利地圖:企業用戶報告原本需要 3-4 天的 20 篇論文與多件專利分析工作,Fugu 只需數小時完成
Sakana Fugu 的戰略意義:對抗「單一供應商依賴」
Sakana AI 在發布公告中特別點出一個地緣政治考量:當企業過度依賴單一 AI 供應商時,一旦遭遇出口管制或服務中斷,整個 AI 應用層將受到衝擊。Fugu 的協調池設計具備彈性替換能力,即使特定模型因政策因素被限制存取,系統也能動態繞過,確保服務連續性。這個定位讓 Sakana Fugu 對非美國企業,尤其是亞太地區用戶,具有額外吸引力。
定價方案:月費 $20 起,企業按量計費
Sakana Fugu 提供訂閱制與按量計費兩種方案:
📦 訂閱制(個人用戶):
- Standard:$20 / 月(輕量日常使用)
- Pro:$100 / 月(Standard 使用量 × 10 倍)
- Max:$200 / 月(Standard 使用量 × 20 倍)
🏢 企業按量計費(Fugu Ultra):
- 輸入:$5 / 百萬 token(超過 272K context 則 $10)
- 輸出:$30 / 百萬 token(超過 272K context 則 $45)
快取輸入:$0.50 / 百萬 token
⚠️ 注意:目前 Sakana Fugu 不支援歐盟/EEA 地區(GDPR 合規仍在準備中),但台灣、日本、亞太地區均可使用。
如何開始使用?
- 前往 sakana.ai/fugu 申請使用
- 選擇訂閱方案或申請企業 API
- 將現有 OpenAI API 端點替換為 Fugu 端點即可
- 無需修改 SDK 或程式架構
總結:AI 競賽的新賽道——「協調智能」vs「單一巨模型」
Sakana Fugu 的出現,代表 AI 產業正在開啟一條新賽道:與其訓練更大的模型,不如訓練一個更聰明的「指揮家」。這個來自東京的 7B 小模型,透過動態協調 GPT-5.5、Claude、Gemini,在多項測試中超越它所指揮的每一個成員——這或許正是下一代 AI 系統的雛形。
對於 AI 開發者、企業用戶、以及希望降低單一供應商風險的組織,Sakana Fugu 是 2026 年下半年最值得關注的 AI 新品之一。