次のフレームを当てはめるだけでは、AIは世界を「理解した」とは言えない——そう問いかける研究が、ICML 2026のOralに選ばれました。
KAISTのSungjin Ahn研究室が発表したNeural Theorizer(NEO)は、言語やLLMの教師信号なしに、観測データだけから世界の仕組みを説明するプログラムを推論する新しいワールドモデルです。投稿論文のわずか0.7%がOralに選ばれるICML 2026で、2026年7月9日(PDT)に口頭発表が予定されています。
この記事では、NEOが従来の予測型ワールドモデルと何が違うのか、Learning-to-Theorize(L2T)という学習パラダイムの中身、実験で示された汎化性能を整理します。
この記事でわかること
- 予測精度だけでは足りない、というNEOの問題設定
- 観測ペアから実行可能な理論を推論する仕組み
- GridWorld・算術・画像編集の3領域での検証結果
- ICML 2026 Oral採択の背景と論文の位置づけ
予測だけでは「理解」とは言えない
ワールドモデル(world model)とは、環境の変化を内部表現として捉え、次の状態や映像を予測するAIの枠組みです。動画生成モデルや強化学習の世界モデル(Dreamerなど)は、潜在空間や観測空間での未来予測精度を「理解」の指標にしています。
一方、発達認知科学では別の見方があります。子どもは言語を十分に習得する前から、感覚入力を予測するだけでなく「世界がどう動くか」という内部理論を組み立てる、とする説があります。いわゆるtheory-theory(理論理論)や「赤ちゃんは科学者」という比喩で知られるこの視点が、NEOの出発点です。
論文はこう問います。世界を理解するとは、次のフレームを当てることと同義なのか。NEOの答えは「いいえ」です。理解とは、観測を生成・変換する再利用可能な仕組み——実行可能な理論——を発見することだ、と位置づけます。
Learning-to-TheorizeとWorld Theory Model
https://arxiv.org/abs/2605.03413
NEOが実装するのは、Learning-to-Theorize(L2T)と呼ばれる学習パラダイムです。入力は観測のペア(x, y)だけです。xは変化前の状態、yは変化後の状態に相当します。動画であれば、時間的に離れた2フレームをそのまま使えます。正解プログラムやタスクラベル、言語説明は与えません。
モデルは、yを再構成するためにxに適用する離散的なプログラムを推論します。このプログラムは、学習されたLanguage of Thought(思考の言語)と呼ばれる記号列として表現されます。Language of Thoughtとは、認知科学で提唱された概念で、思考が離散的・合成的な記号操作で行われるという仮説を指します。NEOでは、意味が事前定義された記号ではなく、観測を通じて意味が付与される記号の語彙をデータから学びます。
理論は、有限個のプリミティブ(基本操作)を順に組み合わせた実行可能プログラムとして表されます。GridWorldの例では、Rotate(回転)、Left(左移動)、Down(下移動)、Paint(塗りつぶし)といった操作がプリミティブとして再発見されます。学習時に「左に下がる」という複合操作だけを丸ごと覚えるのではなく、LeftとDownを分解して再利用できるかが試されます。
論文は、この枠組みをWorld Theory Model(世界理論モデル)と名付けます。推論の中心が「次を予測する」ことではなく、「現象を説明する実行可能な理論を発見する」ことにある点が、従来のワールドモデルとの決定的な違いです。
NEOの内部構造
NEOは確率的ニューラルモデルです。観測ペア(x, y)が与えられると、エンコーダがxを潜在状態に写し、theory programmer(理論プログラマ)が次のプリミティブを逐次選択します。各プリミティブは共有の遷移モデル(transition model)で実行され、潜在状態が段階的に更新されます。最終状態をデコーダに通すと、yの再構成画像が得られます。
プリミティブの選択はVQ-VAE(ベクトル量子化変分オートエンコーダ)のコードブックで離散化されます。記号の意味は事前に与えず、共有の遷移モデルが「この記号を適用すると状態がこう変わる」という操作意味を同時に学習します。構文(どう組み合わせるか)と意味(組み合わせが状態に何をするか)の両方を、観測だけから獲得する設計です。
プログラム長の決定には、最小記述長(MDL: Minimum Description Length)の原理を使います。再構成誤差が十分小さくなる最短のプログラム長を選びます。単純な現象を無理に長い手順に分解すると過学習しやすいため、短くて正確な説明を優先する圧力がかかります。
さらにstate grounding(状態接地)と呼ばれる正則化を入れます。中間段階の潜在状態もデコードしてエンコードし直し、有効な観測の多様体上に留めることで、最終出力だけ合えばよいという抜け道を防ぎます。論文によると、これを外すとプリミティブ性が0.002まで落ち、自己説明・転移の両方がゼロに崩壊します。
OTIBベンチマークで何を測るか
評価には、Observation-to-Theory Induction Benchmark(OTIB)が用意されています。ARC-AGIのように「同じルールの例題グループ」を与えるのではなく、独立した観測ペアの集合から理論を推論する設定です。
評価指標は2つです。self-explainability(自己説明性)は、推論したプログラムを同じ入力に適用してyを再現できるか。transferability(転移可能性)は、同じ潜在プログラムで生成された別の入力xに、そのプログラムを適用して正しいyが得られるか、を測ります。後者が「理論を学んだ」ことの本丸です。単一の入出力ペアを丸暗記しただけでは、転移は成功しません。
テストは3段階に分かれます。学習時と同分布のID、学習時に見なかったプリミティブの組み合わせ(compositional OOD)、学習時より長いプログラム(length OOD)です。αパラメータで学習データに含める組み合わせの割合を制御し、データの偏りが強いほど汎化が難しくなる設定も用意されています。
3領域での実験結果
実験はGridWorld、Arithmetic Factorization Reasoning(算術因数分解推論)、Image Editing(CIFAR-10ベースの画像編集)の3領域で行われました。比較対象は、離散1ベクトル型のDisc-Mono、連続潜在空間のCont-Mono、テスト時最適化付きのCont-Mono-Optです。Disc-MonoはGenieやLAPOに近い設計、Cont-MonoはAdaWorldに近い連続潜在ダイナミクスに相当します。
GridWorld(α=0.33、最も難しい設定)では、NEOのcompositional OOD転移精度は0.933、length OODは0.845でした。一方Disc-Monoは分布内では0.983と高いものの、OODでは0.000に崩壊します。Cont-Monoも自己説明はできるが転移はほぼゼロで、潜在空間にy固有の情報を埋め込んでいるだけだと論文は分析しています。
算術因数分解では、x=73からy=273,750への変化のように、6段階の乗算(×5×5×5×5×3×2)を推論するlength OODが特に困難です。NEO単体のlength OOD転移は0.019〜0.038と低いものの、ベースラインのほぼゼロを上回ります。テスト時に複数候補プログラムをサンプリングするNEO-Sでは、サンプリング予算B=1024でlength OOD転移がα=0.66で0.696、α=1.00で0.707まで改善します。単調なベースラインはサンプリングを増やしても性能が伸びないのに対し、NEOは合成的構造のおかげでテスト時スケーリングが効く、と論文は報告しています。
画像編集でも、α制御のOOD設定とlength OODの両方で、NEOは予測画像と正解のℓ1距離がベースラインより一貫して小さい(良い)結果を示します。未学習の編集操作の組み合わせに対し、ベースラインは1ステップ予測に頼って分解に失敗する一方、NEOは複数プリミティブの連鎖として説明できる、と可視化結果が示されています。
計算コストは、逐次遷移のため学習が単一パス型ベースラインの約2倍です。推論もやや遅いものの、Cont-Mono-Optのような勾配ベース最適化よりは大幅に軽い、と論文に記載があります。
ICML 2026 Oralの意味
https://icml.cc/virtual/2026/oral/71176
論文「Learning to Theorize the World from Observation」は、ICML 2026のOralセッションに採択されています。Sungjin Ahn氏のX投稿によれば、投稿論文の0.7%がOralに選ばれた、とのことです。口頭発表は2026年7月9日0:15〜0:30(PDT)、会場HALL D2で行われます。
著者はDoojin Baek、Gyubin Lee、Junyeob Baek、Hosung Lee、Sungjin Ahn(KAIST)です。arXiv版(2605.03413)は2026年5月に公開され、v2が6月に更新されています。
研究コミュニティでの注目は、ワールドモデル研究の目的関数そのものを問い直している点にあります。潜在空間での予測誤差最小化は、相関を捉えるには有効でも、再利用可能なメカニズムの発見を保証しません。NEOは「説明駆動の汎化(explanation-driven generalization)」という評価軸を提示し、解釈可能なプログラム列として理論を出力する点でも、ブラックボックスな潜在状態モデルと対照的です。
現時点での限界と今後
NEOは研究段階のモデルであり、実世界のロボット制御や大規模動画への直接適用は論文の範囲外です。実験は合成・準合成データが中心で、プリミティブ数やMDL重みλの設定に結果が敏感であることもアブレーションで示されています。λが大きすぎると短い絡み合ったプログラムを覚え込み、プリミティブ性が落ちる、というトレードオフも報告されています。
それでも、観測ペアだけから理論を推論し、未見の組み合わせへ転移できることを3領域で示した点は、基盤モデルや表現学習の文脈で具体的な一歩です。子どもの理論構築を参考にした学習目標が、単なる比喩で終わらず、アーキテクチャとベンチマークまで落とし込まれているのが、この研究の特徴です。