LLMコストを70%減らすOSSルーター「Manifest」入門

AIエージェントのすべてのリクエストを、同じ高性能モデルが処理していませんか。

「現在時刻を取得して」のような単純な呼び出しも、「このコードをリファクタリングして」という複雑な指示も、設定を変えなければ同じモデルが処理します。Manifest（マニフェスト）はその無駄を自動で解消するOSSのLLMルーターです。リクエストを複雑さでスコアリングし、処理できる最安のモデルに振り分けます。コスト削減の目安は最大70%です。

この記事でわかること：

Manifestがどのような問題を解決するか
23次元スコアリングの仕組みと4段階のティア構成
セルフホスト・クラウドの違いと選び方
OpenRouterと何が違うか
Dockerで始める導入手順

AIエージェントのAPIコストが膨らむ理由

AIエージェントは自律的にタスクを実行するぶん、LLM（大規模言語モデル）へのAPIコールが頻繁に発生します。問題は、すべてのリクエストが同じコストで処理されることです。

カレンダーを確認するだけの呼び出しと、数百行のコードを生成する呼び出しでは、必要な処理能力がまったく違います。それでも設定上は同じモデルが呼ばれるため、単純な処理に高額なモデルを使い続ける状態が生まれます。エージェントの稼働時間が増えるにつれ、この非効率が積み重なります。

Manifestはエージェントとプロバイダーの間に入り、この問題を透過的に解決します。

23次元スコアリングで最適なモデルを選ぶ

GitHub - mnfst/manifest: Smart Model Routing for Agents. Cut Costs up to 70% 🦚

Smart Model Routing for Agents. Cut Costs up to 70% 🦚 - mnfst/manifest

GitHub

Manifestはプロキシとして動作します。エージェントからリクエストが届くと、23次元のスコアリングアルゴリズムで複雑さを評価し（処理時間は2ms以内）、以下の4ティアに分類します。

simple：単純な質問・ツール呼び出し
standard：中程度の生成・要約
complex：長文生成・分析
reasoning：推論・数学・コーディング

分類後は、そのティアに設定されたモデルの中で最安のものにルーティングします。フォールバックも内蔵しており、選ばれたモデルが応答しなければ次の候補へ自動的に切り替わります。エージェント側のコードは一切変える必要がありません。

主な機能

予算管理機能では、月間の支出が設定した上限に達したときにメール通知を送るか、リクエストをブロックするかを選べます。予期せぬコスト増加を防ぐガードレールとして機能します。

ダッシュボードでは、トークン数・コスト・モデル・レイテンシをリクエスト単位で確認できます。どのモデルが何にどれだけかかっているかが可視化されるため、ティア設定の最適化に役立ちます。

対応プロバイダーはOpenAI、Anthropic、Google Gemini、DeepSeek、xAI、Mistral AI、Qwen（Alibaba）、MiniMax、Kimi（Moonshot）、Z.ai（Zhipu）、GitHub Copilot、OpenRouter、LM Studio、Ollamaなど、500以上のモデルに対応します。APIキーだけでなく、ChatGPT Plus/Pro/Team、Claude Max/Pro、GitHub Copilotなどの既存サブスクリプションを経由させることも可能です。月額固定のサブスクリプションを最大限に使い倒したい場合にも使えます。

セルフホストとクラウドの2構成

Manifestはセルフホストとクラウドの両方で動作します。

セルフホスト版はDockerイメージとして配布されており、インストールは1コマンドです。

bash <(curl -sSL https://raw.githubusercontent.com/mnfst/manifest/main/docker/install.sh)

実行すると~/manifestにDocker Compose設定が展開され、PostgreSQLとともにスタックが起動します。http://localhost:2099にアクセスして最初のアカウントを作成するとすぐに使い始められます。セルフホスト構成では、ルーティング判断・トークン数・コスト・ダッシュボードデータがすべて自分のPostgreSQLに保存されます。プロンプトの内容がManifestのサーバーを経由することはありません。

クラウド版はapp.manifest.buildからすぐに始められます。Dockerのセットアップが不要で、ブラウザからプロバイダーを接続するだけです。この場合、リクエストはManifestのサーバーを経由しますが、保存されるのはモデル名・トークン数・レイテンシのメタデータのみです。

OpenRouterとの違い

LLMのルーティングで比較に上がりやすいのがOpenRouterです。

Manifestが個人・小規模エージェント向けに設計されているのに対し、OpenRouterはエンタープライズのAPIトラフィックを主な対象としています。コスト面では、OpenRouterがAPIコールごとに5%のマークアップを加算するのに対し、Manifestは無料で利用できます（プロバイダーへのAPI費用は別途かかります）。

ルーティングの透明性も異なります。ManifestはスコアリングのロジックがMITライセンスで公開されており、どのモデルが選ばれた理由を確認できます。OpenRouterのルーティング判断は非公開です。

プロンプトの内容を第三者のサーバーに渡したくない場合は、セルフホスト構成のManifestが選択肢になります。OpenRouterはすべてのリクエストが同社サーバーを経由する設計のため、この要件には対応できません。

なお、最新のv5.55.1（2026年4月27日リリース）ではOpenAI互換のResponses APIプロキシを/v1/responsesで提供しています。既存のOpenAI SDKで書いたコードのエンドポイントを変えるだけでManifestを経由させられます。

まとめ

Manifestはエージェントとプロバイダーの間に置くだけで、リクエストの複雑さに応じてモデルを自動的に切り替えます。ルーティングロジックがオープンソースである点、セルフホストができる点、既存サブスクリプションを使い回せる点が、クローズドなルーティングサービスとの明確な差です。エージェントのAPIコストが気になり始めたタイミングで、最初の選択肢として検討する価値があります。