2026年4月、Anthropicがサイバーセキュリティに特化した新AIモデル「Claude Mythos」を発表しました。
OSやWebブラウザの脆弱性を自動で発見し、エクスプロイトコードまで生成できる能力を持ちますが、一般公開は見送られています。防御側と攻撃側の両方に使えるモデルだからこそ、その扱いに業界が注目しています。
この記事でわかること:
- Claude Mythosの能力と具体的な成果
- 一般公開を見送った理由
- 限定配布プログラム「Project Glasswing」の概要
- Anthropicが推奨する防御戦略
Claude Mythosとは
Claude MythosはAnthropicが2026年4月7日に発表した汎用言語モデルです。コンピュータセキュリティ分野で際立った能力を持ち、これまでのAIモデルとは一線を画す成果を出しています。
前世代モデルのOpus 4.6と比較して、脆弱性エクスプロイトの成功率が181倍に向上。この数字だけでも、そのセキュリティ分野での飛躍がわかります。
何ができるか
Claude Mythosは以下のタスクを自動でこなします。
脆弱性の発見
主要なOS、Webブラウザ、暗号化ライブラリを対象に、数千件の高リスク・クリティカルレベルの脆弱性を特定しました。手動で検証した198件のうち89%が、専門家による重大度評価と完全に一致しています。
エクスプロイトの生成
脆弱性を発見するだけでなく、機能するエクスプロイトコードを自動生成できます。JITヒープスプレイを使ってレンダラーとOSの両サンドボックスをエスケープする、高度な攻撃コードの構築も確認されています。
古いバグの掘り起こし
27年前のOpenBSDのバグ、17年前のFreeBSDのRCE脆弱性(認証なしでroot権限を取得できる深刻なもの)を発見しました。長年見落とされてきた問題を次々と特定できる点が、既存ツールとの大きな違いです。
なぜ一般公開しないか
これだけの能力を持つモデルを一般公開すれば、攻撃者が悪用するリスクが高まります。Anthropicは「移行期間は波乱万丈になる可能性がある」と明言しており、防御側がこの技術に追いつくまでの空白期間を懸念しています。
「利益は、最も早く活用できた側に属する」——Anthropicがこう述べるように、攻撃者がClaude Mythosを先に手にすれば、防御側は不利な立場に置かれます。この非対称性が、慎重な配布方針の背景にあります。
Project Glasswing:限定配布の仕組み
Anthropicは「Project Glasswing(グラスウィング)」というプログラムを通じて、Claude Mythosを選ばれた組織に限定提供しています。
対象は以下の2種類です。
- 重要インフラ企業:通信、金融、エネルギーなど社会基盤を支える事業者
- オープンソース開発者の限定グループ:多くの人が使うOSSのセキュリティ強化を担う開発者
広く公開するのではなく、防御目的で使える組織から段階的に展開していく戦略です。
Anthropicが推奨する防御策
モデルの公開と合わせて、Anthropicは防御側への具体的な対応策を提示しています。
- AIを防御に活用する:攻撃側がAIを使うなら、防御側も同じツールを使う
- パッチサイクルを短縮する:発見された脆弱性に迅速に対応できる体制を整える
- インシデント対応を自動化する:大規模な脆弱性開示に人手だけで対応するのは現実的でない
- インフラを準備する:Claude Mythosが発見できる規模の脆弱性に対処できるよう、組織のセキュリティ基盤を見直す
まとめ
Claude Mythosは、AIがサイバーセキュリティの領域で「人間を超える能力」を持ち始めた一例です。数千件の脆弱性を自動発見し、エクスプロイトまで生成できる能力は、防御と攻撃の両面で業界のあり方を変えます。
Anthropicが限定公開に踏み切った判断は、この能力の危険性を自社が最もよく理解しているからこそです。Project Glasswingを通じた段階的な展開が、この強力なモデルをどう社会に組み込んでいくかの試金石になるでしょう。