Claude Mythosが転機に　米政府AIリリース前審査の全容

AIが政府審査なしに公開できる時代が、静かに終わりを迎えています。

2026年5月6日（現地時間5日）、米商務省配下のCAISI（Center for AI Standards and Innovation）がGoogle DeepMind、Microsoft、xAIと事前評価協定を締結しました。OpenAIとAnthropicとの協定は2024年から存在していましたが、今回の合意でフロンティアAI企業の主要5社すべてが政府評価の枠組みに入ることになります。ホワイトハウスはさらに、AIモデルのリリース前審査を義務化する大統領令の制定を検討しています。

この記事でわかること：

CAISI（米商務省）がGoogleやMicrosoftと結んだ事前評価協定の内容
AnthropicのClaude Mythos Previewとはどんなモデルか
トランプ政権が規制緩和から一転した背景
Project Glasswingの参加企業と活動内容

政府がAIモデルを公開前に評価する枠組みが整った

https://www.cnbc.com/2026/05/05/ai-oversight-trump-google-microsoft-xai.html

CAISIが締結した協定では、企業が政府に対してモデルの早期アクセスを提供し、CAISIが「フロンティアAIの能力評価とAIセキュリティの向上」を目的とした評価を実施します。協定に公開を止める権限は含まれておらず、あくまで「審査した上で公開」という枠組みです。

評価機関としてはNSA、国家サイバー長官室（ONCD）、国家情報長官（DNI）室が候補に挙がっており、英国のAI安全性研究所（AISI）に近い体制を念頭に置いています。これとは別に、ホワイトハウスはAI企業幹部と政府関係者が参加する「AIワーキンググループ」の設立も検討中です。大統領令（Executive Order）を通じた設置が視野に入っていますが、ホワイトハウスは「EO関連の議論は憶測に過ぎない」と公式コメントを出しています。

Claude Mythos Previewが政府を動かした

https://www.anthropic.com/glasswing

Anthropicが2026年4月7日に発表したClaude Mythos Previewは、汎用言語モデルでありながら、ソフトウェア脆弱性の発見と悪用においてきわめて高い能力を持ちます。Anthropicの評価によると、主要なOSすべてと主要ブラウザすべてでゼロデイ脆弱性を発見できます。ゼロデイ脆弱性とは、ソフトウェアの開発者がまだ把握していない未修正の欠陥のことです。

具体的な実績として公開されているのは以下の3件です。OpenBSDに27年間存在していたバグを発見しました。ネットワーク経由で認証なしに任意のマシンをリモートクラッシュさせられる深刻な欠陥で、現在は修正済みです。

動画処理ライブラリFFmpegで16年間見過ごされてきた脆弱性を検出しました。自動テストツールが500万回以上アクセスしても見つけられなかった一行のコードでした。

Linuxカーネルでは複数の脆弱性を連鎖させ、レースコンディションとKASLRバイパスを組み合わせることで、一般ユーザー権限からマシン全制御への権限昇格を実現しました。

数値として特に際立つのが、Firefox 147のJavaScriptエンジンでの比較結果です。現行モデルのClaude Opus 4.6は数百回の試行でエクスプロイト（脆弱性を悪用したコード）の作成に2回しか成功しませんでしたが、Mythos Previewは181件の動作するエクスプロイトを作成しました。脆弱性発見の専門訓練を受けていないAnthropicのエンジニアが夜間に指示を出し、翌朝には完成したエクスプロイトが出来上がっていたケースもあります（参考）。

セキュリティベンチマーク「CyberGym」でのスコアはMythos Previewが83.1%、Claude Opus 4.6が66.6%です。Anthropicはこの能力を「防御に使わなければ攻撃側が先に使う」と判断し、一般公開せずProject Glasswingという形で限定活用しています。

Project Glasswingの体制と規模

Project Glasswingは、Mythos Previewを防御目的に限定して使用するためのAnthropicが主導するイニシアチブです。

参加パートナーにはAWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networksが名を連ねています。さらに40社以上の組織が重要インフラ系ソフトウェアのスキャンと修正にMythos Previewを活用しています。

AnthropicはMythos Previewの利用クレジットとして最大1億ドルを提供し、オープンソースのセキュリティ組織への直接寄付として400万ドルを拠出します。NSAはすでにMythos Previewを使い、政府が調達するMicrosoft製品の脆弱性評価を実施しており、実運用段階に入っています。

規制緩和から急転換した政治的背景

トランプ政権は2025年1月の就任直後、Bidenが署名したAIリスクに関する大統領令を撤廃し、規制緩和路線を明確にしていました。AI政策担当のDavid Sacks氏も2026年3月に退任し、AI関連の政策判断はホワイトハウス首席補佐官のSusie Wiles氏と財務長官のScott Bessent氏が引き継いでいます。

その状況でAnthropicがMythos Previewを発表し、Dario Amodei CEOがホワイトハウスを訪問して政権幹部と協議しました。注目すべきは、国防総省がAnthropicを「サプライチェーンリスク」に指定した（自律兵器や大規模監視への使用制限を拒否したことが理由）直後に、この会合が実現した点です。双方とも「生産的だった」と評価しており、Mythosが政権内の優先課題として扱われたことがわかります。

規制を緩めようとした政権が、Mythos Previewの発表を境に事前審査の義務化を検討する方向に転じるまでにかかった時間は、わずか数週間でした。

AIを取り巻く規制環境の今後

現時点でのCAISI協定は公開をブロックする権限を含まず、主要企業は引き続きモデルをリリースできます。ただし、大統領令が制定されれば、評価を受けてから公開するという流れが法的義務になります。

フロンティアAI企業5社（Anthropic、OpenAI、Google DeepMind、Microsoft、xAI）はすでに協定の枠組みに入っています。未知数なのは、大手以外のスタートアップや国外企業がどう扱われるかです。規制が実施された場合、AI開発のペースに影響が出るのか、安全性の底上げが優先されるのか。Dean Ball元ホワイトハウスAI上級顧問が「難しいバランス」と表現したこの問題は、業界全体が直面している課題です。