数百ページのIPO提出書類を、人間が丸一日かけて読み解く時代は終わりつつあります。

この記事では、Unsiloed AIが公開したデューデリジェンス(投資・取引前の精査)エージェントの仕組みと、SpaceXのIPO提出書類を題材にした実演内容を整理します。

この記事でわかること

  • PDFから表や本文を抽出し、リスク付きメモを生成する3段構成
  • 数値の根拠をPython実行で照合する設計上のポイント
  • ローカルで試せるオープンソース実装の場所と前提条件

https://github.com/Unsiloed-AI/cookbook/tree/main/due-diligence

IPO書類の読解がAIエージェントに向く理由

米国で企業が株式公開(IPO)を行う際、投資家向けの開示書類としてForm S-1をSEC(米国証券取引委員会)へ提出します。書類には財務数値、リスク要因、ガバナンス構造が詰まっており、表組みが複雑なケースも多いです。

2026年5月20日、Space Exploration Technologies Corp.(SpaceX)はナスダックへの上場を目指す予備登録届出書(Form S-1)を提出しました。ティッカーシンボルはSPCXで、ナスダックとナスダック・テキサスの二重上場を予定しています。公開されたS-1は1,000ページを超える分量とされ、投資家やアナリストが全文を精査するには相当な工数がかかります。

従来のRAG(検索拡張生成)だけでは、表の数値が崩れたり、LLMが計算を誤ったりする問題が起きやすいです。IPO書類のデューデリジェンスでは「何が書いてあるか」と「数値が正しいか」の両方が必要になります。

Unsiloed AIが公開したデューデリジェンスエージェント

2026年6月22日、Unsiloed AIの共同創業者であるAman Mishra氏はX(旧Twitter)で、SpaceXのIPO提出書類を題材にしたデューデリジェンスエージェントを紹介しました。提出書類のPDFをアップロードすると、リスクがフラグ付けされたメモが返る仕組みです。メモ内の数値は原本と照合される設計になっています。

実装はGitHubのUnsiloed-AI/cookbookリポジトリ内「due-diligence」レシピとして公開されています。WebアプリとCLIの両方が用意されており、サンプルとしてSpaceXの提出書類抜粋PDF(spacex_sample.pdf)が同梱されています。

https://www.unsiloed.ai/

Unsiloed AIはYC F25出身のスタートアップで、PDFやスキャン文書をMarkdownやJSONに変換するドキュメント解析APIを提供しています。Fortune 150の金融機関やNASDAQ上場企業向けに、数百万ページ規模の文書処理を行っていると公式に述べています。

3段構成でメモを生成する流れ

エージェントは次の3段階で動作します。

1. パーサー(Unsiloed)でPDFを読み取る

UnsiloedのParse APIがPDFをクリーンなMarkdownに変換します。多段組みの法務文書や密な表組み、スキャン画像を含むページにも対応する設計です。40ページ超の文書は自動で分割され、デモ用途では最大120ページまで読み込みます。

2. モデル(LangChain + Claude)でリスク分析

LangChainのcreate_agentでClaude Opus 4.8を起動し、懐疑的なデューデリジェンスアナリストとして振る舞います。財務ハイライト、主要リスク、レッドフラグ、追加調査項目、推奨事項などを構造化JSONスキーマに沿って出力します。リスクは重大度(high / medium / low)とカテゴリ(財務、規制、ガバナンスなど)付きで整理されます。

3. コード実行(E2B)で数値を検証

E2BのセキュアなPythonサンドボックス上で、成長率、CAGR、利益率、レバレッジ比率などを実際に計算します。LLMが暗算で誤る問題を避けるため、原文から取り出した数値だけを入力し、派生指標はrun_pythonツールの結果を根拠にメモへ反映します。ソース数値はUnsiloedの抽出結果に限定し、捏造を防ぐ方針です。

全体の処理フローは「PDF → Unsiloed Parse → Markdown → LangChainエージェント ↔ E2Bサンドボックス → 構造化メモ → HTMLレポート / チャット」という形です。分析後はチャットパネルで提出書類の内容について追加質問もできます。

SpaceX IPOを題材にした意味

SpaceXのS-1は、ロケット打ち上げ(Space)、衛星通信(Connectivity / Starlink)、AI(xAI、Grok、X)の3セグメントを束ねた巨大な開示書類です。2025年の連結売上は187億ドル、調整後EBITDAは66億ドルと記載されています。エヌビディアやアンソロピックとの大型契約、デュアルクラス株式による議決権集中など、投資判断に直結する論点が多数含まれます。

Vesper OSINTの分析では、S-1の分量は1,448ページに達すると報じられています。デモ用エージェントは最大120ページまでの読み込みに制限されているため、実務で全量を扱う場合は分割処理や本番向けのページ上限調整が必要です。それでも、表の抽出精度と数値検証の組み合わせは、IPO前の初期スクリーニングに十分な実用性を示しています。

ローカルで試す手順

動作には3つのAPIキーが必要です。

キー 取得先
UNSILOED_API_KEY Unsiloedダッシュボード
ANTHROPIC_API_KEY Anthropicコンソール
E2B_API_KEY e2b.devダッシュボード

リポジトリをクローンし、依存関係をインストールしたうえで.envにキーを設定します。Webアプリはpython app.pyで起動し、http://127.0.0.1:5058 からPDFをアップロードできます。CLIではpython cli.pyで同梱のSpaceXサンプルを、またはpython cli.py path/to/doc.pdfで任意のPDFを処理します。出力はreports/memo.jsonに保存されます。

類似アプローチとの違い

SEC提出書類向けのOSSプロジェクトは複数存在します。LangGraphで10-Kや10-Qを解析するFinSightや、複数エージェントで企業調査を行うIntelliDD Proなどが挙げられます。今回のレシピの特徴は、ドキュメント解析にUnsiloedを使い、数値検証をE2Bのコード実行に切り出した点です。解析精度と計算の正確性を別レイヤーで担保する設計は、法務・投資・経理など数値ミスが許されない領域に向いています。

投資助言を自動化するものではなく、人間のアナリストが初期レビューを短縮するためのツールです。最終判断は引き続き人間が行う前提で、開示書類のテキストと表を機械可読にし、リスクのたたき台を素早く作る用途に適しています。