GPT-5.6 Sol登場 3段階体制とUltra modeの中身

OpenAIが2026年6月26日、GPT-5.6シリーズの限定プレビューを始めました。フラッグシップのSolに加え、TerraとLunaの3段階体制です。米政府の要請で一部パートナー限定からの公開となり、一般提供は数週間以内を予定しています。

この記事でわかること

GPT-5.6のSol・Terra・Lunaの役割分担と料金
max推論とUltra modeの違い
コーディング・バイオ・サイバーセキュリティでの性能向上
政府要請による限定公開の背景と今後の展開

https://openai.com/index/previewing-gpt-5-6-sol/

GPT-5.6で何が変わったか

GPT-5.6は、これまで1本だったGPTシリーズを3段階の能力ティアに分けたモデル群です。数字の「5.6」が世代を示し、Sol・Terra・Lunaが性能とコストの段階を表します。OpenAIは、この名前が世代ごとに入れ替わらず、それぞれ独立したペースで進化する設計だと説明しています。

Solは最上位モデルで、長期間のエージェント作業や高度な推論を担います。TerraはGPT-5.5と同等の性能を約半額で提供するバランス型です。Lunaは最速・最安で、要約や下書きなど大量処理向けです。

新機能として、Sol向けのmax推論設定とultraモードが追加されました。maxは難しい問題に推論時間を多く割り当てる設定です。ultraは単一エージェントの限界を超え、サブエージェント（下位のAIエージェント）に作業を分割して複雑なタスクを並列処理します。

米政府要請で限定公開が始まった背景

通常のフロントモデル公開とは異なり、GPT-5.6は最初から一部の信頼できるパートナーだけが使える限定プレビューです。OpenAIは公開前に米政府へ計画とモデル能力を事前共有し、政府の要請に応じて限定公開から始めると発表しました。参加パートナーの情報も政府と共有されています。

プレビュー期間中はAPIとCodex経由でのみ利用でき、ChatGPTへの提供はまだ含まれません。OpenAIは数週間以内にChatGPT・Codex・API全体への一般提供を予定しています。CEOのSam Altmanは、政府が当初予定していた広範な公開の代わりに限定プレビューを求めたとXで述べ、できるだけ早く広く使えるようにするとしています。

OpenAIは、この政府アクセス手続きを長期的な標準にすべきではないとも明言しています。一方で、サイバー関連の大統領令フレームワークと将来のフロントモデル公開プロセスの整備に向け、短期的には限定公開が最も確実な道だと判断したと説明しています。

コーディング・バイオ・サイバーでの性能

OpenAIの公式評価では、GPT-5.6 Solは3分野で前モデルを上回る結果を示しています。

コーディングでは、計画・反復・ツール連携を要するコマンドライン作業を測るTerminal-Bench 2.1で新記録を樹立しました。コミュニティ投稿によると、Solは88.8%、Ultra modeでは91.9%に達し、GPT-5.5の88.0%を上回ります。

バイオでは、ゲノム解析を評価するGeneBench v1でGPT-5.5より少ないトークン数で高いスコアを出しました。SecureBio評価では、ウイルス学能力テスト53.5%、分子生物学60.0%、ヒト病原体68.4%、世界水準バイオ68.3%と、GPT-5.5より約9ポイント高い結果が報告されています。

サイバーセキュリティでは、脆弱性研究ベンチマークExploitBenchでAnthropicのMythos Previewと同等の性能を、出力トークン数は約3分の1で達成しました。UCバークレーなどが関与するExploitGymでも、推論量を上げるほどSol・Terra・Lunaの3モデルすべてで能力が向上する傾向が確認されています。

OpenAIは、GPT-5.6 Solは脆弱性の発見と修正支援には優れる一方、エンドツーエンドの攻撃を安定的に実行する用途には向かないと評価しています。Preparedness Framework上のサイバー「Critical」閾値は超えていません。ChromiumとFirefoxの評価ではバグや攻撃の構成要素は特定したものの、条件内で完全なフルチェーン攻撃を自律生成することはなかったと報告されています。

3段階の料金と利用方法

GPT-5.6のAPI料金は100万トークンあたりで、Solが入力5ドル・出力30ドル、Terraが入力2.50ドル・出力15ドル、Lunaが入力1ドル・出力6ドルです。TerraはGPT-5.5相当の性能を約半額、Lunaは同シリーズ最安です。

プロンプトキャッシュも強化され、明示的なキャッシュブレークポイントと最低30分のキャッシュ寿命が追加されました。キャッシュ書き込みは未キャッシュ入力料金の1.25倍、読み取りは90%割引が続きます。

2026年7月には、Cerebras上で最大750トークン/秒のGPT-5.6 Solも提供予定です。初期は選定顧客限定で、容量拡大に合わせて順次広げます。

一般ユーザーが使えるのはまだ先ですが、数週間以内のChatGPT・Codex・API全体への展開が見込まれます。開発者はAPIとCodexの更新情報を確認し、Sol・Terra・Lunaのどれを選ぶかを用途とコストで切り分ける段階に入ります。

安全対策が強化された理由

能力向上に合わせ、OpenAIは「これまでで最も堅牢な安全スタック」をGPT-5.6に導入しました。モデル内の拒否学習、リアルタイムのサイバー・バイオ誤用分類器、アカウント単位の監視、差別化されたアクセス制御を重ねる多層防御です。

自動レッドチーミングにはA100相当のGPU時間を70万時間以上投入し、単一プロンプトではなく多様な文脈で通用するジェイルブレイク（安全制限の回避手法）の探索を行いました。第三者の人間専門家によるレッドチーミングもプレビュー期間中に継続します。

プレビュー中は、正当なセキュリティ研究でもブロックや遅延が起きる可能性があります。OpenAIはこの期間で誤検知の削減と正当利用の通過率を検証し、一般公開前に体験を改善する方針です。システムカードでは、Sol・Terra・Lunaの3モデルすべてがサイバーと生物化学のリスクで「High」に分類され、AI自己改善ではHigh未満と記載されています。