OpenClaw推論費を最大90%削減 LumaDock提携

常時稼働するAIエージェントの推論費が、月数百ドルに達するケースは珍しくありません。2026年6月4日、Neurometric AIとLumaDockが提携し、OpenClaw向けにホスティングと推論ルーティングを一体で提供するスタックを発表しました。

この記事では、提携の内容とコスト削減の仕組み、導入の流れを整理します。

この記事でわかること

Neurometric AIとLumaDockの提携で何が変わるか
ClawPackが推論コストを下げる仕組み
LumaDockのOpenClaw VPSテンプレートの特徴
導入時の料金体系と注意点

https://lumadock.com/openclaw-vps-hosting

ホスティングと推論の両方を一度に解決する

Neurometric AIとLumaDockは2026年6月4日、OpenClawユーザー向けの提携を発表しました（参考）。提携の狙いは、常時稼働するAIエージェントの運用で発生する2つの課題、サーバー構築の手間と推論APIの高額請求を、ひとつのスタックでまとめて解消することです。

OpenClawは、WhatsAppやSlackなどのチャットアプリとLLM（大規模言語モデル）をつなぐオープンソースのAIエージェント基盤です。MITライセンスで公開されており、ユーザー自身のマシンやVPS上でGatewayプロセスを動かしてエージェントを常時稼働させます。設定したフロンティアモデルにすべてのタスクを投げる構成では、月額数百ドル、場合によっては数千ドルに達する推論請求が報告されています（参考）。

今回の提携は「どこで動かすか」と「何で推論するか」の両方に答えを出すものです。LumaDockが常時稼働の土台を、Neurometric AIのClawPackが推論コストの最適化を担います。

なぜ推論費が膨らむのか

OpenClawは自律的にタスクを処理するエージェント基盤です。heartbeat（定期的な自動実行）やツール呼び出しにより、見えないうちにAPIリクエストが積み上がります。分類、抽出、整形、要約といった単純な処理まで、設定した高価なフロンティアモデルに送られると、コストは直線的に増えます。

発表資料によると、OpenClawはGitHubで34万以上のスター、320万人のユーザーを抱えるプラットフォームと紹介されています（参考）。利用者が増えるほど、「エージェントは動いているのに請求だけが重い」という声も増えており、LumaDockのCMO Andrei Romanescu氏は、顧客からコスト問題の問い合わせが相次いでいると述べています。

ClawPackが推論を振り分ける仕組み

https://marketplace.neurometric.ai/clawpack

ClawPackは、Neurometric AIが提供するOpenClaw向けの推論オーケストレーション層です。既存のフロンティアモデルと並行して動作するOpenAI互換のプロバイダーとして組み込まれます。

仕組みは次のとおりです。エージェントからのリクエストを受け取ると、ClawPackがタスクの種類を判定し、分類・抽出・整形・要約などの定型処理をSLM（Small Language Model、特定タスク向けに最適化された小規模言語モデル）へ振り分けます。汎用の巨大モデルで同じ処理を回すより計算コストが低い、という設計思想です。

ClawPackは6つの専門ドメインに対応しています。法務（契約リスク分析）、財務（請求書パース）、コーディング（コードレビュー）、営業、サポート、マーケティングです。Neurometric AIの共同創業者Calvin Cooper氏は、「エージェントの仕事の大半は最も高価なモデルを必要としない。必要なのは適切なモデルだ」と説明しています（参考）。

ユーザー報告では、フロンティアモデルへの呼び出しを60〜90%削減し、出力品質に大きな変化がないケースがあるとされています。ただしこれはNeurometric AIが公表した事例であり、ワークロードによって結果は異なります。

ClawPackの料金

無料プランは月1億トークンまで、クレジットカード不要で利用できます。本番運用向けのProプランは月10ドルでトークン無制限、Advancedプランは月25ドルでフロンティアクラスのモデルも含まれます。いずれもNeurometric AIの公式サイトで確認できます。

LumaDockのOpenClaw VPSテンプレート

LumaDockは、OpenClaw専用のVPSテンプレートを提供するホスティング事業者です。サーバーをデプロイし、OpenClawテンプレートを選ぶだけで、Ubuntu 24.04上にエージェントランタイムがプリインストールされた状態で起動します。SSH接続前に環境が整うため、自前でのセットアップ工数を省けます。

インフラ面では、NVMeストレージ、無制限帯域、フルrootアクセス、24時間サポートが特徴です。Tier III+のデータセンターで運用され、ロンドン、ニューヨーク、フランクフルトなど複数拠点から選択できます。発表資料では月額1.99ドルからと記載されていますが、公式サイトの現行プランは月額3.99ドル（1 vCPU・1 GB RAM）からとなっており、実際の費用は選択するプラン次第です。

ローカルPCでOpenClawを動かす場合、スリープや再起動でエージェントが止まります。VPSに載せることで24時間稼働を維持し、メモリや状態を保持したまま自律処理を続けられます。

導入の流れ

提携により、ホスティングと推論最適化を組み合わせた導入が可能になりました。おおまかな手順は次のとおりです。

LumaDockのダッシュボードでVPSをデプロイし、OpenClawテンプレートを選択する
Neurometric AIのサイトでClawPackの無料APIキーを取得する
OpenClawの設定にClawPackをOpenAI互換プロバイダーとして追加する
Gatewayを再起動し、エージェントのモデル設定でneurometric/clawpackを指定する

ClawPackはデフォルトモデルを置き換えるのではなく、既存のフロンティアモデルと並列で使う設計です。複雑な推論が必要なタスクは従来どおり高価なモデルに任せ、定型処理だけClawPackに回す運用が想定されています。

両社は今後数週間で共同チュートリアルを公開する予定です。LumaDockのブログには、ClawPackで最大90%のコスト削減を実現する手順記事も既に掲載されています。

従来の運用と何が違うか

これまでOpenClawのコスト最適化は、ユーザー個人の工夫に委ねられていました。ローカルモデル（Ollamaなど）への切り替え、heartbeat間隔の調整、タスクごとのモデル手動指定といった方法が一般的です。いずれも有効ですが、設定の複雑さや運用負荷が課題でした。

今回のスタックは、ホスティングと推論ルーティングを製品としてパッケージ化した点が異なります。VPSテンプレートでインフラ構築を短縮し、ClawPackでタスク自動振り分けを行うため、エージェント運用に慣れていない開発者でも導入しやすい構成です。

一方で、ClawPackのSLMルーティングはNeurometric AIのクラウド上で動作します。完全オフライン運用を重視する場合は、引き続きOllamaなどのローカル推論が選択肢になります。用途とデータの扱い方針に応じて、どちらを選ぶか判断する必要があります。

エージェント運用のコスト問題への示唆

OpenClawに限らず、常時稼働するAIエージェントの運用では推論費が最大の変動コストになります。すべての処理を最上位モデルに任せる設計は、機能面では安全策に見えても、請求面では持続不可能になりやすいです。

Neurometric AIとLumaDockの提携は、タスクの性質に応じたモデル振り分けと、エージェント向けホスティングを一体で提供する動きの一例です。エージェント基盤そのものは無料でも、推論とインフラの費用設計が運用の成否を左右する時代に入っています。OpenClawを本番運用する開発者にとって、heartbeatの頻度、モデル選択、ホスティング先をセットで見直す好機です。