ペネトレーションテストを外部に依頼すると、数百万円の費用と数週間の期間がかかる。社内に専門家がいなければ、セキュリティの確認は年に一度が限界という現場も多い。この「セキュリティの空白」を埋めるオープンソースの自律型AIペンテストシステム「PentAGI」が急速に注目を集めています。
この記事でわかること:
- PentAGIが解決するペンテストの課題
- AIエージェントチームがどのように役割分担して動くか
- nmap・Metasploit・sqlmapなど20種以上のツールを自動で使いこなす仕組み
- Dockerを使った基本的な起動手順
- v2.0.0で追加された主な機能
- Shannon Liteとのアプローチの違い
https://github.com/vxcontrol/pentagi
ペンテストが「高価で希少」な理由
ペネトレーションテストは、攻撃者の視点でシステムの脆弱性を探す作業です。偵察(recon)、スキャン、脆弱性の特定、実際の攻撃試行、報告書作成まで、工程は多岐にわたります。これらをこなすには、nmap・Metasploit・sqlmapなど多数のツールの使いこなしに加え、個々の結果を解釈して次の手を判断する経験が必要です。
その専門性の高さから、ペンテストは費用も時間もかかる作業になりがちです。継続的なCI/CDパイプラインに組み込むことは、多くの組織にとって現実的ではありませんでした。
PentAGIは、この問題をAIエージェントの自律実行で解決しようとしています。
PentAGIとは
PentAGIは、ペネトレーションテストの全工程を自律的に実行するオープンソースの多エージェントシステムです。GitHubで16,600以上のスターを集めており(2026年5月時点)、MIT ライセンスで公開されています。
Goで書かれたバックエンドとReactのフロントエンドで構成されており、すべての操作はDockerのサンドボックス環境内で実行されます。LLMプロバイダーとして OpenAI・Anthropic(Claude)・Google Gemini・DeepSeek・Ollamaなど10種以上をサポートしており、ローカルモデルによるエアギャップ環境での運用も可能です。
AIエージェントのチーム構成
PentAGIの中心にあるのは、役割分担されたAIエージェントのチームです。タスクを受け取ると、メインエージェントが全体を統括しながら各専門エージェントに作業を委譲します。
主なエージェントの役割は次のとおりです。
- Pentesterエージェント: 実際の攻撃手順を計画・実行する
- Coderエージェント: カスタムのエクスプロイトコードや自動化スクリプトを書く
- Searcherエージェント: 既知の脆弱性情報やエクスプロイトコードをWebで収集する
- Installerエージェント: 必要なツールやライブラリの環境整備を担う
- Adviserエージェント(メンター): 他エージェントの進捗を監視し、行き詰まりを検知したら別のアプローチを提案する
このチームが連携することで、偵察から脆弱性の実証、報告書生成まで一気通貫で実行できます。
搭載するセキュリティツール群
PentAGIには20種以上のプロフェッショナルなセキュリティツールが組み込まれています。代表的なものを挙げると、ポートスキャンのnmap、脆弱性の実証に使うMetasploit、SQLインジェクション検査のsqlmapなどがあります。これらはすべてDockerコンテナ内の隔離環境で動作するため、テスト対象以外への影響を防げます。
Web情報収集用の内蔵ブラウザも備えており、Tavily・DuckDuckGo・Sploitus(エクスプロイトDB)などの外部検索APIとも連携します。ターゲットに関する最新情報をリアルタイムで取得しながら、攻撃手順を動的に組み立てる仕組みです。
スマートメモリと知識グラフ
PentAGIは、過去のペンテスト結果を長期記憶として保持します。PostgreSQL(pgvector拡張)に保存されたコマンドと実行結果は、以降のタスクで参照できます。
さらにv1.x以降では、Graphiti(Neo4j上に構築)によるナレッジグラフ統合が加わりました。発見した脆弱性・サービス・認証情報などの関係性をグラフとして管理し、ターゲット全体の文脈を把握した上で次の攻撃手順を判断できます。単なる逐次実行ではなく、学習しながら動作する点が大きな特徴です。
起動手順(Dockerを使った場合)
PentAGIはDockerを使って起動します。LinuxのAMD64環境を例に取ると、次の手順で動かせます。
mkdir -p pentagi && cd pentagi
wget -O installer.zip https://pentagi.com/downloads/linux/amd64/installer-latest.zip
unzip installer.zip
sudo ./installer
インタラクティブなインストーラーが起動し、LLMプロバイダーの設定(APIキーの入力)・検索エンジンの選択・セキュリティ設定を対話形式でガイドします。macOS(Intel・Apple Silicon)とWindowsのインストーラーも提供されています。
起動後はWebブラウザからUIにアクセスし、自然言語でテスト対象とゴールを伝えるだけでペンテストが始まります。Grafana・Victoria Metricsによるリアルタイム監視、LangfuseによるLLM呼び出しのコスト分析も画面から確認できます。
v2.0.0の主な変更点(2026年4月)
2026年4月11日にリリースされたv2.0.0では、次の機能が追加されました。
LLMプロバイダーの拡充: DeepSeek・GLM(Zhipu AI)・Kimi(Moonshot AI)・Qwen(Alibaba Cloud)の4プロバイダーが新たに追加されました。これによって中国LLMエコシステムとの接続が標準で可能になり、コスト面での選択肢が広がっています。
分析ダッシュボード: フローごと・エージェントタイプごとのトークン使用量とコスト、キャッシュヒット率、ツール呼び出し頻度を可視化するダッシュボードが加わりました。AnthropicとGeminiのキャッシュコストも個別に表示されます。
実行中のプロバイダー切り替え: ペンテスト実行中にLLMプロバイダーを変更できるようになりました。フローを一時停止して設定を変更後、再開するだけで引き継げます。
Docker ホストネットワークモード: OOB(Out-of-Band)攻撃シナリオに対応するためのホストネットワークモードが追加されました。
Shannon Liteとのアプローチの違い
同じくAIを使った自律型ペンテストツールとして、以前の記事でShannon Liteを紹介しました(参考)。両者のアプローチは大きく異なります。
Shannon Liteはソースコードを静的解析して攻撃ベクターを仮説立て、「エクスプロイトの実証がなければ報告しない」ポリシーのもとで動くホワイトボックス型です。コードへのアクセスが前提で、CIパイプラインへの組み込みを想定しています。
一方のPentAGIは、ソースコードへのアクセスを前提としないブラックボックス型です。外部から見えるサービスに対して、人間のペンテスターと同じように偵察・スキャン・攻撃試行を繰り返します。既存のペンテストベンダーへの依頼を代替するユースケースに向いています。
まとめ
PentAGIは、AIエージェントの多段チームによって、従来は人間の専門家が担っていたペネトレーションテストの工程を自律実行するオープンソースツールです。MIT ライセンスで公開されており、セルフホスト環境に完全対応しています。
16,600以上のスターが示すように、セキュリティエンジニアやDevSecOpsに関わる開発者からの関心は高まっています。定期的な外部ペンテストのコスト削減や、継続的なセキュリティ検証の自動化を検討している組織にとって、試す価値のある選択肢です。