Claude選挙対策を強化誤情報・影響工作への新しい防御策

選挙シーズンにAIが誤情報を拡散したら——そのリスクをAnthropicは本気で塞ぎにいっている。

2026年4月24日、AnthropicはClaude向けの選挙安全策の最新情報を公開した。2026年米中間選挙を前に、政治的中立性の評価・誤情報対策・影響工作への防御という3つの柱を強化した内容だ。

この記事でわかること：

Claudeが実施している選挙誤情報対策の全体像
最新モデル（Opus 4.7・Sonnet 4.6）の評価スコア
ユーザーが投票情報を求めた際の案内機能

https://www.anthropic.com/news/election-safeguards-update

政治的中立性をスコアで評価

Anthropicは各モデルのリリース前に、異なる政治的立場からのプロンプトに対して一貫した深さと分析精度で応答しているかを評価する。一方の立場には詳細に答えながら、もう一方には一文しか返さないような偏りは低スコアになる仕組みだ。

2026年の最新テストでは、Claude Opus 4.7が95%、Claude Sonnet 4.6が96%のスコアを記録した。

中立性のトレーニングはモデルの性格訓練とシステムプロンプトの2段階で行われる。Claude.ai上のすべての会話に政治的中立の指示を含むシステムプロンプトが適用されている。外部機関とも連携しており、バンダービルト大学のシンクタンク「The Future of Free Speech」や「Foundation for American Innovation」「Collective Intelligence Project」と、表現の自由に関するモデル挙動のレビューを進めている。

誤情報・影響工作への防御テスト

Anthropicは600件のプロンプト（有害リクエスト300件＋正当リクエスト300件）を使って、Claudeが適切に対応できるかをテストした。有害リクエストには選挙に関する誤情報生成の試みが含まれ、正当リクエストには選挙キャンペーン素材の作成や市民参加リソースの提供が含まれる。

モデル	適切な応答率
Claude Opus 4.7	100%
Claude Sonnet 4.6	99.8%

影響工作への耐性テストは、偽ペルソナや捏造コンテンツを使った複数回の会話シミュレーションで行われる。複数ターンにわたって段階的に誘導する手口を再現した条件下では、Sonnet 4.6が90%、Opus 4.7が94%の適切応答率だった。

今回初めて実施された「自律的影響工作テスト」では、AIが人間の指示なしにキャンペーンを計画・実行できるかを検証した。安全策とトレーニングを施した最新モデルはほぼすべてのタスクを拒否した。安全策を外した状態（モデル本来の能力を測る目的）ではMythos PreviewとOpus 4.7だけがタスクの半数以上を完了したとされており、Anthropicは引き続き監視と改善を続けるとしている。

自動検知と専任チームによる常時監視

使用ポリシーの違反検知は、自動分類器と専任の脅威インテリジェンスチームの2系統で行われる。

AnthropicのUsage Policyが禁止しているのは以下の行為だ。

欺瞞的な政治キャンペーンの実施
政治的言説に影響を与えるための偽デジタルコンテンツの生成
選挙詐欺・投票システムへの干渉
投票プロセスに関する誤情報の拡散

2つの検知経路を常時稼働させることで、通常の会話を妨げずに実際の悪用に絞った対応を実現している。

投票情報バナーで信頼できるリソースへ誘導

ユーザーが有権者登録・投票所・選挙日程・候補者情報についてClaude.ai上で質問すると、信頼できる情報源へのリンクを含む「選挙バナー」が表示される。この機能は2024年に初めて導入され、今回が2回目のアップデートになる。

2026年の米中間選挙では、バナーのリンク先はDemocracy Worksが提供する非党派リソース「TurboVote」に設定されている。TurboVoteは有権者登録の状況・投票所の場所・選挙日程・投票用紙の内容をリアルタイムで提供する。ブラジルの選挙向けにも同様のバナーが予定されており、今後対象選挙の拡大も検討している。

ウェブ検索で最新情報も取得

Claudeにはトレーニングデータの知識カットオフがあり、候補者の発表や最新の世論調査結果は自動では反映されない。ウェブ検索が有効な環境では、Claudeがリアルタイムの情報を取得して回答に反映する。

選挙関連の質問に対してウェブ検索が適切にトリガーされるかを評価した結果、Opus 4.7は92%、Sonnet 4.6は95%の確率でウェブ検索を実行した。米中間選挙に関する質問のほとんどで、ユーザーは最新情報を受け取れる状態にある。

まとめ

今回の発表は、2024年の大統領選以来続く選挙対策の第2フェーズと位置づけられる。政治的中立性のスコア評価、600件規模の誤情報テスト、自律的影響工作テストの初実施、TurboVoteとの連携強化と、従来の施策を定量化・拡張したアップデートだ。Claudeを選挙情報の調査や市民活動のリソース作成に使うユーザーにとって、より信頼性の高い情報アシストが期待できる。