Claude Mythosとは｜脆弱性を自動発見するAnthropicの新AIモデル

2026年4月、Anthropicがサイバーセキュリティに特化した新AIモデル「Claude Mythos」を発表しました。

OSやWebブラウザの脆弱性を自動で発見し、エクスプロイトコードまで生成できる能力を持ちますが、一般公開は見送られています。防御側と攻撃側の両方に使えるモデルだからこそ、その扱いに業界が注目しています。

この記事でわかること：

Claude Mythosとは

Claude MythosはAnthropicが2026年4月7日に発表した汎用言語モデルです。コンピュータセキュリティ分野で際立った能力を持ち、これまでのAIモデルとは一線を画す成果を出しています。

前世代モデルのOpus 4.6と比較して、脆弱性エクスプロイトの成功率が181倍に向上。この数字だけでも、そのセキュリティ分野での飛躍がわかります。

Claude Mythosは以下のタスクを自動でこなします。

脆弱性の発見
主要なOS、Webブラウザ、暗号化ライブラリを対象に、数千件の高リスク・クリティカルレベルの脆弱性を特定しました。手動で検証した198件のうち89%が、専門家による重大度評価と完全に一致しています。

エクスプロイトの生成
脆弱性を発見するだけでなく、機能するエクスプロイトコードを自動生成できます。JITヒープスプレイを使ってレンダラーとOSの両サンドボックスをエスケープする、高度な攻撃コードの構築も確認されています。

古いバグの掘り起こし
27年前のOpenBSDのバグ、17年前のFreeBSDのRCE脆弱性（認証なしでroot権限を取得できる深刻なもの）を発見しました。長年見落とされてきた問題を次々と特定できる点が、既存ツールとの大きな違いです。

これだけの能力を持つモデルを一般公開すれば、攻撃者が悪用するリスクが高まります。Anthropicは「移行期間は波乱万丈になる可能性がある」と明言しており、防御側がこの技術に追いつくまでの空白期間を懸念しています。

「利益は、最も早く活用できた側に属する」——Anthropicがこう述べるように、攻撃者がClaude Mythosを先に手にすれば、防御側は不利な立場に置かれます。この非対称性が、慎重な配布方針の背景にあります。

Anthropicは「Project Glasswing（グラスウィング）」というプログラムを通じて、Claude Mythosを選ばれた組織に限定提供しています。

対象は以下の2種類です。

広く公開するのではなく、防御目的で使える組織から段階的に展開していく戦略です。

モデルの公開と合わせて、Anthropicは防御側への具体的な対応策を提示しています。

Claude Mythosは、AIがサイバーセキュリティの領域で「人間を超える能力」を持ち始めた一例です。数千件の脆弱性を自動発見し、エクスプロイトまで生成できる能力は、防御と攻撃の両面で業界のあり方を変えます。

Anthropicが限定公開に踏み切った判断は、この能力の危険性を自社が最もよく理解しているからこそです。Project Glasswingを通じた段階的な展開が、この強力なモデルをどう社会に組み込んでいくかの試金石になるでしょう。