ロボットの次の動きを決める世界モデルは、GPU上のブラックボックスになりがちです。誰かが「この推論結果は正しい」と主張しても、自分で同じ計算をやり直さなければ確かめられません。

2026年6月、Abdelhamid Bakhta(AbdelStark)氏が ProvableWorldModel を公開しました。学習済みのJEPA世界モデルが実際に動いたことを、ラップトップのCPUだけでミリ秒単位で検証できます。

この記事でわかること

  • JEPA世界モデルとProvableWorldModelの関係
  • 推論の正当性を証明する「commit-and-audit」の仕組み
  • ラップトップCPUで試せるデモの手順
  • この技術が証明する範囲と、まだ証明しない範囲

世界モデルの推論を、誰でも検証できるようにする

世界モデル(world model)は、環境の状態と行動の履歴から「次に何が起きるか」を予測するAIです。ロボット制御や自動運転の計画に使われます。従来は推論をGPU上で実行し、結果をそのまま信じるしかありませんでした。

ProvableWorldModelは、この信頼の問題に正面から取り組みます。推論を実行した側が監査用の証明データ(AuditArtifact)を発行し、検証者はモデルを再実行せずに、その推論が約束どおり行われたかを確認します。LambdaClassのCommitLLMで言語モデル向けに開発された「commit-and-audit」方式を、世界モデル向けに拡張したのが本プロジェクトです。

対象となるモデルは、LeWorldModel(LeWM)です。LeWMはJEPA(Joint Embedding Predictive Architecture)方式の行動条件付き世界モデルで、ピクセルではなく潜在表現(latent)空間で次の状態を予測します。JEPAはYann LeCun氏らがMeta AIで提唱した自己教師あり学習の枠組みで、表現空間での予測に特化しています。

ProvableWorldModelは、Hugging Face上の学習済みチェックポイント quentinll/lewm-pusht を量子化し、192次元・6ブロック・16ヘッドの予測器(2,437オペレーション)の推論を整数演算で再現します。推論そのものは約49ミリ秒、検証は約29ミリ秒で完了します(合成重みでのベンチマーク値)。

commit-and-auditで何を証明するのか

ProvableWorldModelの核心は、大きな行列積(matmul)をFreivaldsアルゴリズムで効率的に検査し、それ以外の演算は整数演算で正確に再実行する点にあります。

処理の流れは次のとおりです。

  1. チェックポイントを整数固定小数点に量子化し、重みとルックアップテーブルをMerkleコミットメントで固定する
  2. 推論を整数演算で実行し、全オペレーションのトレースを記録する
  3. Fiat-ShamirトランスクリプトからFreivaldsチャレンジを導出し、各行列積が v·x == r·z を満たすか検査する
  4. アテンション、ソフトマックス、GELU、LayerNormなどを正確に再計算し、ロールアウト・コスト・argminを検証する

検証器(pwm-verifier)は no_std で動作し、浮動小数点を一切使いません。そのため、GPUやPythonランタイムなしのCPU環境でも検証できます。約10万回のFreivaldsチェックをまとめた場合の誤検知確率はおよそ2のマイナス44乗とREADMEで示されています。

1つの行列積の出力を改ざんすると、検証は FreivaldsCheckFailed で拒否されます。デモではこの改ざん検知も意図的に実行し、証明の堅牢さを確認できます。

ラップトップCPUで動かすデモ

AbdelStark氏は2026年6月12日のX投稿で、「ラップトップのCPU、あるいはスマートフォン上で、コミットされたモデルが主張どおりに実行されたことを誰でもミリ秒単位で検証できる」と発表しました。

現時点で手軽に試せるのは、ターミナルUI付きの pwm-tui デモです。初回実行時に学習済みチェックポイントとPushTタスクの実データ(lerobot/pusht)をダウンロードし、PyTorchエクスポーターで量子化したあと、純Rustで証明・検証・改ざんチェックまで一気通貫で実行します。

git clone https://github.com/AbdelStark/ProvableWorldModel
cd ProvableWorldModel
cargo run -p pwm-tui --release

2回目以降はキャッシュを使えばネットワーク不要で、おおよそ1秒で完了します。Dockerを使う場合は docker compose up --build で同様のパイプラインを試せます。インタラクティブな解説サイトも公開されており、Freivaldsチェックの仕組みをブラウザ上で体験できます。

証明の範囲と限界

ProvableWorldModelが証明するのは「量子化された整数演算として、コミットされた重みと入力に対して推論が正しく行われた」という事実です。物理世界の予測が正しいか、PyTorchの浮動小数点実行と完全一致するか、チェックポイントのエクスポートが正直に行われたかは、証明の対象外です。

READMEでも「公開する主張は、証明された文の部分集合でなければならない」と明記されています。ロボット制御に使う前に、何が保証され何が保証されないかを区別することが重要です。

現行バージョン(V0)で実装済みなのは、1ステップの予測(P0)、自己回帰ロールアウト(P1)、固定候補からの計画選択(P2)です。CEMプランナー全体(P3)やピクセル入力からのエンドツーエンド推論(P4)は今後の課題として残されています。

JEPAエコシステムとの位置づけ

JEPA系の世界モデルは、Meta AIの JEPA-WMs やV-JEPA 2など、複数の研究が並行して進んでいます。LeWorldModelは約1,500万パラメータで単一GPU数時間の学習が可能とされ、基盤モデルベースの世界モデルより高速に計画できる点が特徴です。

同じAbdelStark氏は、Rust製のJEPA実装 jepa-rs も公開しています。jepa-rsはCPU・WebAssembly・WebGPUなど複数バックエンドでJEPAモデルを動かすための基盤で、ProvableWorldModelはその中のLeWMに検証レイヤーを載せた形と捉えられます。

世界モデルがロボットや自律エージェントの意思決定に使われる時代、推論結果を第三者が検証できる仕組みは実用性の面で大きな意味を持ちます。ProvableWorldModelはその第一歩として、ラップトップCPUだけで動く検証可能なJEPA世界モデルを示しました。