GPT-5.6 Proの3D理解 WebGL2単一HTMLで実演

未発表とされるGPT-5.6 Proが、WebGL2だけで3Dモデルを単一HTMLファイルに書き起こした例がXで公開され、話題になっています。画像入力なしのテキストプロンプトから、ブラウザでそのまま動く3D表現を組み立てる能力が、モデルの空間理解力を測る新しい指標として注目されています。

この記事では、Token Gremlin氏の投稿内容と、同じ系統のコミュニティ検証を整理します。

Token Gremlin氏が公開したWebGL2生成の概要
BMPT-72砲塔ベンチマークが難しい理由
Anthropic Fable 5との比較で語られていること
OpenAIがまだ公式発表していない点

🚨 AI Leaks | Token Gremlin (@TokenGremlin) on X

Another incredible result from GPT-5.6 Pro, proving that this model understands any 3D model extremely well. This time, …

X (formerly Twitter)

GPT-5.6 Proは未発表、先行テストの報告が相次いでいる

2026年6月時点で、OpenAIはGPT-5.6やGPT-5.6 Proの存在を公式に認めていません。APIドキュメントや料金ページにも、GPT-5.6系のモデルIDは掲載されていません。

それでもX上では、ChatGPTで「GPT-5.5 Pro」を選んだ一部ユーザーに、別モデルが配布されているのではないかという報告が続いています（参考）。The Informationは、OpenAIのChief Scientist Jakub Pachocki氏が社内向けに「GPT-5.5より意味のある改善」を示す次期モデルがあると伝えたと報じています。ただし、これはA/Bテストや公開日を裏付けるものではありません。

WebGL2単一HTMLで3Dを生成した投稿

2026年6月21日、AI情報を発信するToken Gremlin氏は、GPT-5.6 Proの出力例として3Dモデル生成結果を公開しました。投稿本文は次のとおりです。

Another incredible result from GPT-5.6 Pro, proving that this model understands any 3D model extremely well. This time, made with WebGL2 in a single .html file.

要点は3つです。第一に、対象モデルがGPT-5.6 Proであるとされる点。第二に、3D形状の理解精度が高いと評価されている点。第三に、Three.jsなどの高水準ライブラリではなく、WebGL2を直接使い、1つの.htmlファイルに収めた点です。

WebGL2（Web Graphics Library 2）は、ブラウザ上でGPUを使って3D描画を行うグラフィックスAPIです。Three.jsのようなライブラリはWebGLの上に便利な抽象化を載せますが、今回の出力はAPIを直接叩く形です。頂点バッファやシェーダー、描画ループまでモデル自身が組み立てる必要があり、SVG生成やフロントエンド再現より一段難易度が高い作業になります。

Token Gremlin氏は、検証プロンプトの作成者として@mirochillをクレジットしています。同氏は3D・SVG・ゲーム生成の比較テストを継続的に公開しており、GPT-5.6 Pro関連の投稿の中心人物の一人です。

BMPT-72砲塔ベンチが3D理解の試金石になった理由

Token Gremlin氏の投稿より数日前、2026年6月18日には、別の3D生成比較が広く共有されました。AIテスターのChetas Lua氏が、mirochill氏作成のプロンプトでGPT-5.6 ProとAnthropic Fable 5を突き合わせた事例です（参考）。

プロンプトは次の一文です。

make bmpt-72 turret in three js – low poly with recognizable silhuette in one html code block .

BMPT-72は、ロシアのウラルヴァゴンザヴォド社がT-72戦車の車体をベースに開発した戦車支援戦闘車です。無人砲塔に30mm機関砲2門、対戦車ミサイル発射機4基、同軸機関銃を載せ、シルエットの特徴がはっきりしています。低ポリゴン（面数を抑えた簡略3D）で「見た目が分かる砲塔」を1つのHTMLに収める条件は、次の能力を同時に試します。

実在オブジェクトの外形的知識
3D空間での比率・配置の推論
Three.jsで動くコードの生成
制約（単一ファイル、低ポリ、シルエット維持）の遵守

WinCentralの整理によると、GPT-5.6 Proの出力はBMPT-72らしい形状を保った一方、Fable 5の出力は砲塔の特徴を捉えきれていないとの批判がX上に上がりました。Chetas Lua氏も「GPT 5.6 Pro continues to mog Fable in 3d test」と投稿し、ゲーム生成のワンショットでも優位との報告を続けています（参考）。

生成時間の伸びが示すトレードオフ

3Dベンチの報告には、品質向上と引き換えに処理時間が長くなる傾向も共通しています。Conor Dart氏は、物理演算とカメラ操作を備えた3Dブラウザゲームを1プロンプトで生成した際、GPT-5.6 Pro相当の出力に約60分かかったと報告しています。同種の作業をGPT-5.5 Proで試した場合は約10分だったとのことです（参考）。

Chetas Lua氏も、フロントエンド生成の初回出力に20〜40分かかったと述べています。一方、別のベンチマーカーChris氏は、宇宙船生成ではFable 5が依然として形状面で優位だったと報告しており、タスクごとに結果は分かれます。

3D理解が向上したとしても、すべての幾何学タスクで競合を上回るわけではない、というのが現時点の実情です。

なぜ3D生成がLLM評価の焦点になっているか

従来のテキストベンチマークだけでは測れない能力が、3Dコード生成には含まれます。モデルは自然言語の指示を、実行可能なJavaScriptとGPU描画命令に変換しなければなりません。SVG生成やスクリーンショットからのUI再現と並び、2026年6月のGPT-5.6 Pro報告で特に目立っている分野です。

mirochill氏のテスト群には、BMPT-72砲塔のほか、ボクセルアートやSVGの都市風景なども含まれます。共通するのは「視覚的概念をコードに落とす」点です。Token Gremlin氏のWebGL2単一HTMLの例は、Three.js版BMPT-72ベンチの延長線上にあり、ライブラリに頼らない実装でも同様の空間理解が示せるかを問う試みと読めます。

現時点で言えること、言えないこと

言えるのは、先行テスターがGPT-5.6 Proと称するモデルで、3D関連タスクの改善を報告している事実です。WebGL2単一HTMLの生成、BMPT-72砲塔のThree.js再現、SVGやフロントエンド生成の比較は、いずれもコミュニティ発の検証に留まります。

言えないのは、モデルが本当にGPT-5.6 Proなのか、公開時期、ベンチマーク数値、API料金です。OpenAIが公式に発表するまでは、スクリーンショットや生成時間の報告を参考情報として扱う必要があります。

それでも、3D形状を単一HTMLに閉じ込める試みは、LLMが「説明する」段階から「空間をコード化する」段階へ進んでいる兆候として、開発者コミュニティの関心を集め続けています。