複数のAIモデルを組み合わせたいが、選定・委譲・検証の仕組みを自前で組むのは負担が大きい——そんな悩みに応える新製品が登場しました。
この記事では、Sakana AIが2026年6月22日に公開したマルチエージェント・オーケストレーションシステム「Sakana Fugu」の概要と使い方を整理します。
この記事でわかること
- Sakana Fuguが解決する課題と、1本のAPIで動く仕組み
- 標準版「Fugu」と高品質版「Fugu Ultra」の違い
- ベンチマーク結果と、既存の単一モデルAPIとの位置づけ
- 導入方法と料金体系
1本のAPIで複数モデルを束ねる「指揮者」
Sakana Fuguは、複数の大規模言語モデル(LLM)を動的に協調させるマルチエージェント・オーケストレーションシステムです。開発者はOpenAI互換の単一エンドポイント(https://api.sakana.ai)にリクエストを送るだけで、内部ではモデル選択・タスク委譲・結果検証・回答統合が自動で行われます。
Sakana AIは、Fugu自体も「他のLLMを呼び出すことに特化した言語モデル」として学習したと説明しています。必要に応じてFugu自身を再帰的に呼び出すこともあり、人手で設計したワークフローではなく、クエリごとに協調パターンを組み立てます。基盤技術はICLR 2026採択論文の「TRINITY」と「Conductor」に基づき、進化戦略や強化学習でオーケストレーション方針を学習しています。
なぜ今、オーケストレーションなのか
フロンティア級のLLMは、コーディング・数学・セキュリティなど分野ごとに強みが分かれています。一方、単一ベンダーのAPIに依存すると、規制変更やアクセス制限の影響を直接受けます。2026年6月12日、Anthropicは米政府の指示によりFable 5とMythos 5の外国籍ユーザー向け提供を停止しました。Sakana AIはこの文脈を踏まえ、エージェント・プールを入れ替え可能にしたFuguを、ベンダー依存のリスク緩和策として位置づけています。
従来、複数モデルの協調にはLangGraphのようなフレームワークを自前で組む必要がありました。Fuguはその複雑さをサーバー側に閉じ込め、クライアントからは通常のLLM呼び出しと同じ体験で利用できます。
FuguとFugu Ultraの2段構え
公開時点で2つのモデルが用意されています。
Fugu(標準版)は性能とレイテンシのバランスを重視します。技術レポートによると、入力ごとに最適なワーカーモデルを1つ選び、直接呼び出しと同等の応答速度を目指します。コーディング、コードレビュー、チャットボットなど日常的な用途向けです。データやコンプライアンス要件に応じて、特定プロバイダーやモデルをプールから除外する設定も可能です。
Fugu Ultraは回答品質を最優先します。複数の専門エージェントを組み合わせた深いオーケストレーションを行い、論文再現、サイバーセキュリティ分析、特許調査など多段階タスクを想定しています。レイテンシは増えますが、難易度の高い問題で精度を引き上げます。
いずれもコンテキストウィンドウは100万トークン、推論の深さはreasoning.effortパラメータでhighとxhigh(maxも可)の2段階を指定できます。
ベンチマークで示された性能
Sakana AIが公表した2026年6月時点の評価では、Fugu Ultraが複数のフロンティアモデルと同等以上のスコアを記録しています。公表値の一例は次のとおりです。
| ベンチマーク | Fugu | Fugu Ultra |
|---|---|---|
| SWE-Bench Pro | 59.0 | 73.7 |
| TerminalBench 2.1 | 80.2 | 82.1 |
| LiveCodeBench | 92.9 | 93.2 |
| Humanity’s Last Exam | 47.2 | 50.0 |
比較対象にはGemini 3.1 Pro、Opus 4.8、GPT 5.5が含まれます。Sakana AIはFugu Ultraがエンジニアリング・科学・推論の厳しいベンチマークでAnthropicのFable 5やMythos Previewと「肩を並べる」と述べています。ただしFable 5とMythos Previewは一般公開されておらず、Fuguのエージェント・プールにも含まれていません。数値はベンダー自身の評価であり、独立した第三者検証ではない点に留意が必要です。
ベータ期間では約500人のユーザーが参加し、コードレビューで他ツールが3件程度の指摘にとどまる場面で20件以上の問題を洗い出した、といったフィードバックが報告されています。
使い方と料金
利用はSakanaのコンソールでAPIキーを発行し、既存のOpenAI SDKのbase_urlをhttps://api.sakana.ai/v1に差し替えるだけです。Chat CompletionsとResponsesの両エンドポイントに対応しています。
Codex CLIとの連携も用意されており、次のコマンドでセットアップできます。
curl -fsSL https://sakana.ai/fugu/install | bash
codex-fugu
料金はサブスクリプションと従量課金の2系統です。サブスクリプションはStandard(月額20ドル)、Pro(月額100ドル)、Max(月額200ドル)の3段階で、いずれもFuguとFugu Ultraの両方を利用できます。Fugu Ultraの従量課金は、入力100万トークンあたり5ドル、出力100万トークンあたり30ドルです(コンテキスト272K超は加算)。標準版Fuguは複数エージェントを使っても、関与したモデルのうち最上位の料金のみが課金される仕組みです。
なお、GDPR対応のため現時点ではEU・EEA域では利用できません。
単一モデルAPIとの違い
ClaudeやGPTのような単一フロンティアモデルは、1つの巨大な重みセットで回答します。Fuguは「指揮者モデル+ワーカー・プール」という構成で、タスクに応じて最適なモデル群を編成します。ルーティング方針は学習済みであり、単純なプロキシ転送とは異なります。
一方でトレードオフもあります。Fugu Ultraはどのモデルが実際に使われたかをユーザー側から確認できず、オーケストレーション用トークンも課金対象になります。コスト予測や監査要件が厳しい環境では、プール除外設定や従量課金の内訳フィールド(orchestration_input_tokensなど)を確認しながら導入を検討する必要があります。
マルチモデル構成を自前で組まずにフロンティア級の性能を狙いたい開発者にとって、Sakana Fuguは新たな選択肢になります。GitHubリポジトリ(SakanaAI/fugu)には技術レポートやCodex設定例も公開されており、APIの挙動を深く理解したい場合はあわせて参照するとよいでしょう。
