AIがサイバー攻撃を加速させる時代に、防御側にも同等の武器が必要になった。OpenAIが2026年4月30日に発表したGPT-5.5 Cyberは、サイバーセキュリティの防御用途に特化したAIモデルです。英国AI安全性研究所(AISI)の評価では、テストした中で最も強力なモデルの1つと位置づけられています。
この記事でわかること
- GPT-5.5 Cyberの概要と従来モデルとの違い
- 英国AISIが実施した性能評価の結果
- Trusted Access for Cyber(TAC)プログラムの仕組みと利用条件
- Anthropic Mythosとの比較
GPT-5.5 Cyberとは何か
https://openai.com/index/scaling-trusted-access-for-cyber-defense/
GPT-5.5 Cyberは、OpenAIのフラグシップモデルGPT-5.5をサイバーセキュリティ用途に特化させた派生モデルです。CEOのSam Altmanは「数日以内に重要なサイバー防御者へのロールアウトを開始する」と発表しました。
このモデルは一般公開されていません。脆弱性の特定、ペネトレーションテスト、マルウェアのリバースエンジニアリングといった防御的なセキュリティ業務を支援する目的で開発されています。前身のGPT-5.4 Cyberは2026年4月中旬にリリースされており、GPT-5.5 Cyberはその後継にあたります。
OpenAIの内部評価では、サイバーセキュリティ領域のリスク分類で「High」と判定されています。ただし、人間の介入なしにゼロデイ脆弱性を自律的に開発できる「Critical」の閾値には達していません。
英国AISIの評価結果
英国AI安全性研究所(AISI)は、GPT-5.5の早期チェックポイントに対してサイバー能力の評価を実施しました。結果は注目に値します。
95項目のサイバータスクのうち、Expert(上級)レベルでの平均成功率は71.4%でした。比較すると、AnthropicのMythos Previewは68.6%、GPT-5.4は52.4%、Claude Opus 4.7は48.6%です。GPT-5.5は、AISIがテストした中で最も高いスコアを記録しています。
さらに印象的なのは、32ステップの企業ネットワーク攻撃シミュレーション「The Last Ones(TLO)」の結果です。このシミュレーションは、偵察からActive Directoryの横展開、CI/CDパイプラインの侵害、データの窃取までを再現したもので、人間の専門家なら約20時間かかると見積もられています。GPT-5.5は10回中2回、このシミュレーションを完遂しました。エンドツーエンドで完了した2番目のモデルです。
10分で解いたリバースエンジニアリング課題
AISIのレポートで特に目を引くのが、「rust_vm」と呼ばれるリバースエンジニアリング課題の結果です。
この課題は、カスタム仮想マシンを実装したRustバイナリと、そのVM用のバイトコードで構成されています。解くには、VMのオペコードを逆解析してディスアセンブラを構築し、認証ロジックを解読して正しいパスワードを導き出す必要があります。セキュリティ専門家がBinary NinjaやZ3などのツールを駆使して約12時間かかった課題です。
GPT-5.5はこれを10分22秒、APIコスト1.73ドルで解きました。ELFバイナリのリロケーションテーブルからジャンプテーブルを解決し、ISA(命令セットアーキテクチャ)を復元。Pythonエミュレータを作成して検証した後、ディスアセンブラを構築して認証アルゴリズムを特定し、パスワードを算出しています。
Trusted Access for Cyber(TAC)の仕組み
https://openai.com/index/trusted-access-for-cyber/
GPT-5.5 Cyberへのアクセスは、OpenAIのTrusted Access for Cyber(TAC)プログラムを通じて提供されます。対象は以下の組織です。
- 政府機関
- 重要インフラの運用者
- セキュリティベンダー
- クラウドプラットフォーム事業者
- 金融機関
個人のセキュリティ研究者は、chatgpt.com/cyberで本人確認を行うことでTACに参加できます。企業はOpenAIの担当者を通じて申請します。TACプログラムには複数の階層があり、上位の階層ほどGPT-5.4 CyberやGPT-5.5 Cyberなどの高度なモデルにアクセスできます。
OpenAIはTACの一環として、認定されたセキュリティ組織向けに1,000万ドルのAPIグラントも提供しています。
Anthropic Mythosとの比較
GPT-5.5 Cyberの発表は、Anthropicが4月に公開したClaude Mythos Previewへの対抗策としての側面もあります。
Mythosは数千件の新規ゼロデイ脆弱性を自律的に発見し、ブラウザエクスプロイトやFreeBSDのリモートコード実行エクスプロイトを構築する能力を持っています。Anthropicはこのモデルを危険と判断し、一般公開を見送りました。アクセスは約50の組織に限定されています。
OpenAIはこれに対し、より広範な配布を選択しました。TACプログラムを通じて数千人の個人防御者と数百のチームにアクセスを提供する方針です。ただし、The Registerなどのメディアは、Anthropicの限定公開を批判していたOpenAI自身も結局はアクセスを制限している点を指摘しています。
AISIの評価では、Expert課題でGPT-5.5がMythosをわずかに上回りました。一方、TLOシミュレーションではMythosが10回中3回完遂に対してGPT-5.5は2回と、Mythosがリードしています。両モデルとも、産業制御システム攻撃シミュレーション「Cooling Tower」は完遂できていません。
サイバー防御AIの今後
AISIのレポートは重要な示唆を含んでいます。Mythosに続いてGPT-5.5が同水準のサイバー能力に到達したことは、特定モデルの突破ではなく、AI全体の傾向を反映しているという見解です。長期的な自律性、推論能力、コーディング能力の向上に伴い、サイバー能力も副産物として高まっている可能性があります。
防御側にとっての課題は明確です。攻撃に使えるモデルの能力が急速に向上する中、防御ツールとしてのAI活用を同じ速度で進める必要があります。GPT-5.5 CyberやTACプログラムはその一歩ですが、アクセスが限定されている以上、すべての組織が恩恵を受けられるわけではありません。AISIが指摘するように、今後のモデルでさらに能力が向上する可能性が高く、防御側のエコシステム構築は急務です。
