AIが自分自身の設計図を書き換え、次世代のAIを生み出す——そんな研究の本丸を担う専任組織が、東京に立ち上がりました。

Sakana AIは2026年6月、再帰的自己改善(Recursive Self-Improvement、RSI)に特化した研究グループ「Sakana AI RSI Lab」を正式に設立したと発表しました。RSIは、AIがAI開発プロセスそのものを再設計し、自律的に性能を積み上げていく技術です。巨大なGPUクラスターへの依存を前提にしない研究路線として、業界の注目を集めています。

この記事でわかること

  • RSI Labが目指す「AIがAIを作る」研究の全体像
  • 過去2年間の6つの研究成果がどう統合されるか
  • 東京に拠点を置く理由と、4段階のロードマップ
  • 自己改善AIの安全面への取り組み

RSI Labとは何か

https://sakana.ai/rsi-lab/

RSI Labは、Sakana AI社内に設置された専任の研究グループです。任務は明確で、「AIを使ってAI開発プロセスそのものを再設計する」ことにあります。

従来のフロンティアAI開発は、巨大な単一モデルをより多くの計算資源で訓練する「スケーリング」が主流です。一方、Sakana AIは進化や適応を軸にしたアーキテクチャで、少ない試行回数から良い解を見つける方向を追求してきました。RSI Labは、この方針を自己改善の文脈で一本化する拠点です。

公式発表では、RSI Labの目標を「オープンエンドで適応的なアーキテクチャが、集合的に自己改善する」システムの構築としています。静的なツールとしてのAIから、自律的な研究者としてのAIへ移行する、というビジョンが据えられています。

なぜ今、専任ラボが必要になったのか

業界では自己改善AIの理論的可能性についての議論が増えています。しかし、Sakana AIは過去2年間で実用的なマイルストーンを次々と公開してきました。RSI Labはゼロからの出発ではなく、これらの成果を統合して次の段階へ進むための組織です。

人間の知能が無限の資源から生まれたわけではない——進化という制約の中で、発見を積み重ねてきた、という考え方がRSI Labの根底にあります。同様に、日本のような計算資源に制約がある環境では、効率的な自己改善こそが構造的な必然だと同社は位置づけています。

6つの研究成果が示す足場

RSI Labの前身となる研究は、時系列で次の6つに整理できます。

LLM-Squared(2024年)は、オックスフォード大学やケンブリッジ大学との共同研究です。LLMがLLMの訓練方法を発明する枠組みで、進化的ループを通じてLLMが独自に書き上げた選好最適化アルゴリズム「DiscoPOP」を生み出しました。

Darwin Gödel Machine(2025年)は、ブリティッシュコロンビア大学(UBC)との共同研究です。エージェントが自身のコードベースを自律的に書き換え、変異体の系譜を維持しながら性能を高めます。SWE-benchでは20.0%から50.0%へ、Polyglotでは14.2%から30.7%へと自動改善を達成しました。手作りのエージェントAiderを大きく上回る結果です。

ShinkaEvolve(2025年)は、わずか150サンプルで複雑な最適化問題を解き、Mixture-of-Experts(MoE)モデルの負荷分散ロス関数を新たに生成しました。サンプル効率の高さが特徴です。

ALE-Agent(2025年)は、AtCoder Heuristic Contest 058で804人の参加者のうち1位を獲得しました。試行錯誤の失敗から教訓を抽出する自己学習機構により、人間の専門家を上回るアルゴリズムを自律的に導出しています。

Digital Red Queen(2026年)は、MITとの共同研究で、Core Warというチューリング完全なサンドボックス内で敵対的共進化を実現しました。サイバーセキュリティへのRSI応用の基盤を築く研究です。

The AI Scientist(2024〜2026年)は、アイデア生成から実験、論文執筆、ピアレビューまでを自動化するシステムです。2026年3月26日付けでNatureに掲載され、国際的な評価を受けました。

これらの共通点は、計算資源の投入量ではなく、アイデアと進化的最適化ループで成果を出してきた点にあります。

4段階のロードマップ

Sakana AIはRSIの到達過程を4つのフェーズで描いています。

第1段階はAgent-Native Modelsです。チャット用途ではなく、エージェント用途に特化した認知アーキテクチャとワールドシミュレータを最初から設計します。

第2段階はThe AI Scientistです。これらのアーキテクチャを使い、研究のアイデア出しから実験、知識の拡張までを自動化します。

第3段階がRecursive Self-Improvementそのものです。AIエージェントが基盤モデルのアーキテクチャコードを自ら書き、ベンチマークし、検証する転換点に到達します。

第4段階はDemocratized AIです。適度な計算資源でRSIを実現し、フロンティアAIの地理的集中を変えることを目指します。自己改善が一部の巨大クラスターだけの資産ではなく、公共の利益になる状態が最終目標です。

Agent-Native ModelsがAI Scientistを動かし、AI Scientistがより良いAgent-Native Modelsを作る——この戦略的ループが、指数関数的に改善するAIの軌道を描くとしています。

東京に拠点を置く理由

フロンティアRSIの挑戦は、世界最大規模の2つの計算クラスター内でほぼ独占的に行われています。日本は科学的才能とエンジニアリング文化を持ちながら、ハイパースケーラーと比べると計算資源は限定的です。

Sakana AIは、この制約こそが汎用性の高い技術を生む設計条件だと考えています。日本のソブリンAI(主権AI)インフラへの国家的投資も後押しとなり、RSI Labは東京本社を拠点に研究・エンジニアリング人材の拡充を進めます。

安全面への姿勢

自己改善ループには、分布外へのドリフトや、ベンチマークは通過するが実運用で失敗する改変、制約を迂回するショートカットなどの失敗モードがあります。Sakana AIは2年間の開発でこれらを直接経験してきたと述べています。

RSI Labは、ネガティブな結果も含めてオープンに公開し、検証可能な安全策を自己改善ループの設計段階から組み込む方針です。責任あるRSIは能力の制約ではなく、持続可能な能力の前提だと位置づけています。Darwin Gödel Machineの開発でも、サンドボックス環境での実行や変更履歴の追跡可能性を重視してきた実績があります。

業界への意味

RSI Labの設立は、Sakana AIが「計算資源の軍拡競争」から別の道を選ぶ意思表示でもあります。自己改善型AIが実用段階に入れば、大規模データセンターへの構造的優位性を相殺できる可能性があります。ただし、現時点では戦略的な賭けに留まり、大規模クラスターの優位を完全に覆した実証はまだありません。

それでも、SWE-benchで20%から50%への自動改善や、Nature掲載のAI Scientistなど、具体的な成果が積み上がっている点は無視できません。RSI Labは、これらを統合して次の飛躍を狙う本格的なコミットメントです。