AIエージェントは賢くなっても、PDFやスキャン画像を正確に読み取れなければ実務では使えません。LlamaIndexが2026年4月29日に公開したLlamaParse MCPサーバーは、この問題をMCP(Model Context Protocol)経由で解決します。

この記事でわかること:

  • LlamaParse MCPサーバーで何ができるか
  • Parse・Classify・Splitの3ツールの役割
  • Claude DesktopやCursorへの接続手順
  • 無料枠と料金体系

LlamaParse MCPサーバーとは

https://github.com/run-llama/llamacloud-mcp

LlamaParse MCPサーバーは、LlamaIndexが提供するドキュメント処理プラットフォーム「LlamaParse」の機能を、MCPプロトコル経由でAIエージェントから直接呼び出せるようにしたツールです。LlamaIndexのCEOであるJerry Liu氏が4月29日にXで公開を発表しました。

これまでもLlamaParseのAPIは存在しましたが、MCPサーバーとして再構築されたことで、Claude DesktopやCursor、VS Code Copilotなど、MCP対応のクライアントからワンステップで接続できるようになりました。エージェントが会話の流れの中で文書を解析し、分類し、分割する処理を自然に実行できます。

なぜMCPで文書処理が必要なのか

AIエージェントに文書を扱わせる場面は増えています。契約書のレビュー、請求書からのデータ抽出、複数書類の仕分けなど、業務で扱うドキュメントは構造も形式もバラバラです。

従来のOCRは文字を読み取るだけで、表の構造やグラフの数値を正しく再現できませんでした。LlamaParseはVLM(Vision Language Model)を組み合わせた「エージェンティックOCR」という手法を採用しています。文書の種類に応じて最適なモデルの組み合わせを選び、セルフコレクションのループを回すことで、従来のOCRでは難しかった複雑なレイアウトにも対応します。

この処理をMCPサーバーとして公開したことで、エージェント側のコードを書かなくても設定ファイルを数行編集するだけで文書処理の能力を追加できるようになりました。

3つのコアツール

LlamaParse MCPサーバーは、以下の3つのツールを中心に構成されています。

Parse:130以上の形式に対応するエージェンティックOCR

PDF、Word、PowerPoint、Excel、HTMLに加え、画像やスキャン文書など130以上のファイル形式をMarkdownに変換します。表やグラフの構造を保持したまま抽出するため、LLMが内容を正しく理解しやすい形で出力されます。処理のティアは「fast」「accurate」「agentic」の3段階があり、agenticティアではVLMによる視覚的な解析とセルフコレクションが加わります。

Classify:自然言語ルールで文書を自動分類

「請求書」「契約書」「領収書」など、自分で定義したカテゴリに文書を自動で振り分けます。分類ルールは自然言語で記述できるため、プログラミングなしで業務に合わせたカテゴリ設計が可能です。

Split:結合された文書を論理単位で分割

1つのPDFに複数の文書がまとめて入っているケースに対応します。AI分類を使って文書の境界を検出し、論理的な単位に自動分割します。大量のスキャン文書を処理する業務で、手作業の仕分けを不要にします。

接続方法

MCP対応クライアントへの接続は、設定ファイルにサーバー情報を追加するだけで完了します。事前にuvのインストールとLlamaCloud APIキーの取得が必要です。APIキーはLlamaCloudダッシュボード(cloud.llamaindex.ai)から無料で発行できます。

Claude Desktopの場合、設定ファイルのmcpServersに以下のような記述を追加します。

{
  "mcpServers": {
    "llamaparse": {
      "command": "uvx",
      "args": [
        "llamacloud-mcp@latest",
        "--api-key",
        "<YOUR_API_KEY>"
      ]
    }
  }
}

インデックス検索やデータ抽出エージェントも同時に追加できます。--indexオプションでLlamaCloudに作成したインデックスを、--extract-agentオプションで抽出エージェントを指定すると、RAG検索や構造化データの抽出もエージェントから利用可能になります。

トランスポートはstdio、SSE、streamable-httpの3種類に対応しており、ローカル利用だけでなくHTTP経由でのリモート接続にも対応します。

料金と無料枠

https://www.llamaindex.ai/pricing

LlamaParseはクレジットベースの従量課金です。サインアップすると毎月10,000クレジット(約1,000ページ相当)が無料で付与されます。

Starterプランは月額無料で40,000クレジットが含まれ、超過分は従量課金(上限月500ドル)です。Enterpriseプランはカスタム価格で、無制限のユーザー・プロジェクト・インデックスに対応します。クレジットの消費量はパースモード(fast/accurate/agentic)やキャッシュの有無によって変動します。

類似ツールとの違い

文書処理のMCPサーバーとしては、Google CloudのDocument AI MCPやAWSのTextract連携なども選択肢に入ります。LlamaParse MCPの特徴は、Parse・Classify・Splitの3機能を1つのMCPサーバーにまとめている点と、エージェンティックOCRによる高精度な解析です。

LlamaIndexが2026年4月に公開したParseB enchベンチマークでは、14手法を比較した結果、LlamaParse Agenticが表・グラフ・忠実性・フォーマット・視覚グラウンディングの全5次元で競争力のあるスコアを出し、総合84.9%を記録しています。

また、ローカル環境で動かせるオープンソースの軽量パーサー「LiteParse」もLlamaIndexが公開しています。APIキーなしで手軽に使いたい場合はLiteParse、高精度な解析や分類・分割まで必要な場合はLlamaParse MCPという使い分けが可能です。

まとめ

LlamaParse MCPサーバーは、AIエージェントに高精度な文書処理を直結させるための実用的な選択肢です。MCP対応のクライアントなら設定ファイルの編集だけで導入でき、無料枠で月1,000ページまで試せます。文書を扱うエージェントワークフローを構築しているなら、最初に検討すべきツールの一つです。