PentAGI：自律AIがペネトレーションテスト全工程を自動化

ペネトレーションテストを外部に依頼すると、数百万円の費用と数週間の期間がかかる。社内に専門家がいなければ、セキュリティの確認は年に一度が限界という現場も多い。この「セキュリティの空白」を埋めるオープンソースの自律型AIペンテストシステム「PentAGI」が急速に注目を集めています。

この記事でわかること：

PentAGIが解決するペンテストの課題
AIエージェントチームがどのように役割分担して動くか
nmap・Metasploit・sqlmapなど20種以上のツールを自動で使いこなす仕組み
Dockerを使った基本的な起動手順
v2.0.0で追加された主な機能
Shannon Liteとのアプローチの違い

https://github.com/vxcontrol/pentagi

ペンテストが「高価で希少」な理由

ペネトレーションテストは、攻撃者の視点でシステムの脆弱性を探す作業です。偵察（recon）、スキャン、脆弱性の特定、実際の攻撃試行、報告書作成まで、工程は多岐にわたります。これらをこなすには、nmap・Metasploit・sqlmapなど多数のツールの使いこなしに加え、個々の結果を解釈して次の手を判断する経験が必要です。

その専門性の高さから、ペンテストは費用も時間もかかる作業になりがちです。継続的なCI/CDパイプラインに組み込むことは、多くの組織にとって現実的ではありませんでした。

PentAGIは、この問題をAIエージェントの自律実行で解決しようとしています。

PentAGIとは

PentAGIは、ペネトレーションテストの全工程を自律的に実行するオープンソースの多エージェントシステムです。GitHubで16,600以上のスターを集めており（2026年5月時点）、MIT ライセンスで公開されています。

Goで書かれたバックエンドとReactのフロントエンドで構成されており、すべての操作はDockerのサンドボックス環境内で実行されます。LLMプロバイダーとして OpenAI・Anthropic（Claude）・Google Gemini・DeepSeek・Ollamaなど10種以上をサポートしており、ローカルモデルによるエアギャップ環境での運用も可能です。

AIエージェントのチーム構成

PentAGIの中心にあるのは、役割分担されたAIエージェントのチームです。タスクを受け取ると、メインエージェントが全体を統括しながら各専門エージェントに作業を委譲します。

主なエージェントの役割は次のとおりです。

Pentesterエージェント: 実際の攻撃手順を計画・実行する
Coderエージェント: カスタムのエクスプロイトコードや自動化スクリプトを書く
Searcherエージェント: 既知の脆弱性情報やエクスプロイトコードをWebで収集する
Installerエージェント: 必要なツールやライブラリの環境整備を担う
Adviserエージェント（メンター）: 他エージェントの進捗を監視し、行き詰まりを検知したら別のアプローチを提案する

このチームが連携することで、偵察から脆弱性の実証、報告書生成まで一気通貫で実行できます。

搭載するセキュリティツール群

PentAGIには20種以上のプロフェッショナルなセキュリティツールが組み込まれています。代表的なものを挙げると、ポートスキャンのnmap、脆弱性の実証に使うMetasploit、SQLインジェクション検査のsqlmapなどがあります。これらはすべてDockerコンテナ内の隔離環境で動作するため、テスト対象以外への影響を防げます。

Web情報収集用の内蔵ブラウザも備えており、Tavily・DuckDuckGo・Sploitus（エクスプロイトDB）などの外部検索APIとも連携します。ターゲットに関する最新情報をリアルタイムで取得しながら、攻撃手順を動的に組み立てる仕組みです。

スマートメモリと知識グラフ

PentAGIは、過去のペンテスト結果を長期記憶として保持します。PostgreSQL（pgvector拡張）に保存されたコマンドと実行結果は、以降のタスクで参照できます。

さらにv1.x以降では、Graphiti（Neo4j上に構築）によるナレッジグラフ統合が加わりました。発見した脆弱性・サービス・認証情報などの関係性をグラフとして管理し、ターゲット全体の文脈を把握した上で次の攻撃手順を判断できます。単なる逐次実行ではなく、学習しながら動作する点が大きな特徴です。

起動手順（Dockerを使った場合）

PentAGIはDockerを使って起動します。LinuxのAMD64環境を例に取ると、次の手順で動かせます。

mkdir -p pentagi && cd pentagi
wget -O installer.zip https://pentagi.com/downloads/linux/amd64/installer-latest.zip
unzip installer.zip
sudo ./installer

インタラクティブなインストーラーが起動し、LLMプロバイダーの設定（APIキーの入力）・検索エンジンの選択・セキュリティ設定を対話形式でガイドします。macOS（Intel・Apple Silicon）とWindowsのインストーラーも提供されています。

起動後はWebブラウザからUIにアクセスし、自然言語でテスト対象とゴールを伝えるだけでペンテストが始まります。Grafana・Victoria Metricsによるリアルタイム監視、LangfuseによるLLM呼び出しのコスト分析も画面から確認できます。

v2.0.0の主な変更点（2026年4月）

2026年4月11日にリリースされたv2.0.0では、次の機能が追加されました。

LLMプロバイダーの拡充: DeepSeek・GLM（Zhipu AI）・Kimi（Moonshot AI）・Qwen（Alibaba Cloud）の4プロバイダーが新たに追加されました。これによって中国LLMエコシステムとの接続が標準で可能になり、コスト面での選択肢が広がっています。

分析ダッシュボード: フローごと・エージェントタイプごとのトークン使用量とコスト、キャッシュヒット率、ツール呼び出し頻度を可視化するダッシュボードが加わりました。AnthropicとGeminiのキャッシュコストも個別に表示されます。

実行中のプロバイダー切り替え: ペンテスト実行中にLLMプロバイダーを変更できるようになりました。フローを一時停止して設定を変更後、再開するだけで引き継げます。

Docker ホストネットワークモード: OOB（Out-of-Band）攻撃シナリオに対応するためのホストネットワークモードが追加されました。

Shannon Liteとのアプローチの違い

同じくAIを使った自律型ペンテストツールとして、以前の記事でShannon Liteを紹介しました（参考）。両者のアプローチは大きく異なります。

Shannon Liteはソースコードを静的解析して攻撃ベクターを仮説立て、「エクスプロイトの実証がなければ報告しない」ポリシーのもとで動くホワイトボックス型です。コードへのアクセスが前提で、CIパイプラインへの組み込みを想定しています。

一方のPentAGIは、ソースコードへのアクセスを前提としないブラックボックス型です。外部から見えるサービスに対して、人間のペンテスターと同じように偵察・スキャン・攻撃試行を繰り返します。既存のペンテストベンダーへの依頼を代替するユースケースに向いています。

まとめ

PentAGIは、AIエージェントの多段チームによって、従来は人間の専門家が担っていたペネトレーションテストの工程を自律実行するオープンソースツールです。MIT ライセンスで公開されており、セルフホスト環境に完全対応しています。

16,600以上のスターが示すように、セキュリティエンジニアやDevSecOpsに関わる開発者からの関心は高まっています。定期的な外部ペンテストのコスト削減や、継続的なセキュリティ検証の自動化を検討している組織にとって、試す価値のある選択肢です。

https://github.com/vxcontrol/pentagi