
国産 AI 大手の Sakana AI が、商用フラッグシップを公開した、という話。
Sakana Fugu という名前のマルチエージェント・オーケストレーション基盤の β テスターを、4 月 24 日付けの公式ブログで募集開始しています。要するに、複数のフロンティア基盤モデル(OpenAI / Google / Anthropic)を一つの「協調プール」として扱い、タスクごとに最適な組み合わせを動的に呼び出す仕掛けが API として外に出てくる、ということ。
ここがポイントで、Sakana AI は以前から「巨大モデルを単独で叩くより、役割の異なる複数エージェントを協調させる方が伸びる」という路線を採っており、Evolutionary Model Merge、AI Scientist、ShinkaEvolve、AB-MCTS と研究を積み上げてきました。Sakana Fugu はその研究路線を、外部に売れる商品として束ねた最初のプロダクト、という位置づけです。
日本発の AI 研究機関がフロンティアモデルの上に層を載せる戦略を取った、という事実は重い。要するに、GPT-5.4 や Claude Opus 4.6 に正面から対抗するのではなく、それらの上で動くオーケストレータで勝負するという話。
Sakana Fugu 自身は 小規模なモデルで、「いまの問題はどのモデルに振るのが効くか」「複数のモデルにどう役割を割るか」を学習で覚えていく構造。重要なのは、人間がドメイン知識でルールを書くのではなく、Sakana Fugu が独自に「人間には思いつきにくい効率的な協調パターン」を発見していく点だと公式ブログは強調しています。
技術的なバックボーンは ICLR 2026 採択の 2 本——Trinity(進化的な LLM コーディネーター学習)と Conductor(自然言語ベースのエージェント指揮)——で、それを商品向けに改良したものが今回の Fugu。
ベンチマークで Sakana が出している数字。fugu-ultra(フル版)が GPQAD で 95.1、LCBv6 で 93.2、SWEPro で 54.2。比較用に並んでいるのは Gemini 3.1(high)、GPT 5.4(high)、Opus 4.6(max)。3 ベンチマークすべてで fugu-ultra がトップ、というスコアです。
| タスク | Gemini 3.1 high | GPT 5.4 high | Opus 4.6 max | fugu-mini | fugu-ultra |
|---|---|---|---|---|---|
| GPQAD | 94.4 | 90.9 | 92.7 | 92.4 | 95.1 |
| LCBv6 | 90.3 | 92.1 | 92.4 | 90.4 | 93.2 |
| SWEPro | 48.4 | 51.2 | 53.4* | 51.3 | 54.2 |
ただし注意点もあって、Opus 4.6 max の SWEPro 53.4 は Anthropic 独自スキャフォールドでの自己申告値で、Sakana 側の検証ではタイムアウトが多発したため公式値を採用、と但し書きが入っています。要するに、3 番目のスコアは横並びとは言いにくいセル。
提供形態は OpenAI 互換 API。GPT / Gemini / Claude を API で使っている既存ワークフローはほぼそのまま差し替えで動く設計、というのが β の売り。ラインナップは latency 重視の Sakana Fugu Mini 🐟 と、フル協調を回す Sakana Fugu Ultra 🐡 の 2 系統。応募はブログ末尾の Google Forms から。締切日について本ブログ記事中には記載がないため、興味があれば早めに出しておく、というのが現実的なところ。
「フロンティアモデルを 1 個契約して使う」設計が現実解だった時代から、「複数フロンティアモデルを束ねて切り替えるレイヤを買う」設計が選択肢に入ってきた、という話。日本の AI スタートアップで OpenAI / Anthropic / Google の API キーを 3 本管理している現場には、このオーケストレータ層を商用で買う、という判断が今後出てきます。第 2 フェーズはどこのラボから出るか、見ものです。
Sakana AI 公式ブログ「Sakana Fugu」発表記事
arXiv — TRINITY: An Evolved LLM Coordinator(ICLR 2026、英語)
arXiv — Learning to Orchestrate Agents in Natural Language with the Conductor(ICLR 2026、英語)