個人エージェント40Bトークン実運用のマルチモデル構成

「エージェントを本気で回すと、どれだけトークンを食うのか」——Henry Mascot氏が2026年6月25日に公開した運用実績は、この問いに具体的な数字で答えています。

この記事では、Mascot氏の個人エージェントチーム「Enterprise Crew」が年初から400億トークン（40B）を消費したという報告を軸に、オーケストレーター・コーディングエージェント・LLMの三層構成を整理します。

この記事でわかること

Enterprise Crewが公開した運用規模とエージェント構成
OpenClawとNousResearchを軸にしたオーケストレーションの役割分担
Codex・Cursor・Claude Code・Droidを束ねるGeordiの位置づけ
GPT-5.5を主力に、GeminiやMiniMaxなどをcron向けに使い分けるモデル戦略

https://x.com/iAmHenryMascot/status/2070215366467260592

400億トークン規模の個人エージェント運用

Mascot氏はX（旧Twitter）で「The Burn 🔥」と題し、Enterprise Crewが年初から40Bトークンを消費したと報告しました。Enterprise Crewは、Mascot氏が運用する個人向けのマルチエージェントチームです。Ada、Zora、Geordi、Scotty、Spockの5体が役割分担し、調査・コーディング・自動化などを担います。

40Bトークンは、チャットをたまに使うレベルとは桁が違います。OpenClawのcron（定期実行タスク）が24時間回り続け、複数モデルにジョブを振り分ける構成が前提です。Mascot氏はGitHub上で「本番運用で直面した課題を解くツール」として、Enterprise Crew Skillsを公開しており、model-orchestratorやself-healingなど、運用を支えるスキル群が揃っています。

オーケストレーター層：OpenClawとNousResearch

Mascot氏の投稿では、エージェント／オーケストレーターが4つと明記されています。そのうちOpenClawが1つ、NousResearch製のフレームワークが1つです。

GitHub - openclaw/openclaw: Your own personal AI assistant. Any OS. Any Platform. The lobster way. 🦞

Your own personal AI assistant. Any OS. Any Platform. The lobster way. 🦞 - openclaw/openclaw

GitHub

OpenClawは、ローカルで動くパーソナルAIアシスタントのゲートウェイです。WhatsAppやSlackなど複数チャネルへのルーティング、cron、マルチエージェント分離、スキル管理を1つの制御面でまとめます。Enterprise Crewの基盤として、エージェントの起動・定期タスク・ツール連携を担います。

NousResearch側は、同社が2026年2月に公開したHermes Agentが該当します。Hermes Agentはタスク完了後にスキルファイルを自動生成し、次回以降の実行を高速化する「学習ループ」が特徴です。OpenClawがマルチチャネルとタスク管理のハブ、Hermesが深い推論とスキル蓄積を担う、という併用パターンはコミュニティでも語られています。Mascot氏は両方をオーケストレーターとして並列運用している形です。

コーディング層：Geordiと4つのハーネス

コード生成は「Geordi」と呼ばれるビルダーワークフローが担当します。Mascot氏の投稿では、GeordiがCodex、Cursor、CC（Claude Code）、Droidの4つをコーディングエージェントとして使い分けていると述べられています。

https://github.com/h-mascot/Enterprise-Crew-skills/tree/main/geordi

Geordiは、ゴールとPRD（製品要求仕様）のストーリーを登録し、選んだランタイムでミッションを実行するミッションランナーです。geordi run --mode codexでCodexを、--mode cursorでCursor CLIを、--mode claudeでClaude Codeを、--mode droidでFactory Droidを起動します。実装と検証を分離し、ログとgitのレシートを残す設計です。

4つのハーネスは、Agent Client Protocol（ACP）経由でOpenClawからルーティングできます。OpenClawのacpx拡張では、Codex、Cursor、Gemini CLI、Droid、Kimi CLIなどが標準エージェントとして登録されています。Geordiはその上に、PRD駆動の反復ビルドループを載せる役割を持ちます。同リポジトリのralphスキルは、CodexやClaude Codeを繰り返し起動してPRD項目をすべて完了するまで回す自律コーディングループです。

モデル層：GPT-5.5主力とcron向けマルチモデル

対話や推論の主力モデルはGPT-5.5（high推論モード）です。OpenAIは2026年4月23日にGPT-5.5を公開し、エージェント的コーディングやツール連携に強いフロンティアモデルと位置づけています。reasoning.effortにlowからxhighまでの段階があり、highは複雑なエージェントタスク向けの設定です。

一方、cronやループ処理にはGemini、Kimi、GLM、MiniMaxなど複数モデルを使い分けます。Enterprise Crew Skillsのmodel-orchestratorは、タスクの複雑度に応じて3段階のティアに分類し、プロバイダーの健全性・クォータ・コストでルーティングします。

ティア	タスク例	優先モデル
T1（単純）	ハートビート、ディスクチェック	MiniMax → Gemini Flash → Kimi
T2（中程度）	メール仕分け、通知ルーティング	Gemini Flash → Kimi → MiniMax
T3（複雑）	調査統合、ブログ執筆	Opus → Sonnet → Kimi → Gemini Flash

6時間ごとにオーケストレーションを回し、2つ以上のプロバイダーがダウンした場合はクリシスモードで重要cronだけを維持します。Z.ai（GLM）のクォータエラーと残高切れを区別するなど、実運用で起きる課題への対処も組み込まれています。

実務に活かせる設計のポイント

Enterprise Crewの構成から読み取れるのは、「1つの最強モデルに全部任せない」という設計思想です。

オーケストレーターはOpenClawでタスク管理とチャネル統合を担い、NousResearchのHermesでスキル蓄積を補完します。コーディングはGeordiがCodex・Cursor・Claude Code・Droidを状況に応じて切り替えます。モデル選択は、対話品質が必要な場面ではGPT-5.5 high、定期ジョブでは安価なモデルやクォータに余裕のあるプロバイダーへ振り分けます。

Mascot氏はGitHubでsession-cleaner（セッション整理）、council（分野別マルチエージェント討議）、self-healing（チェックポイントとフォールバック）など、運用で実際に使ったスキルを公開しています。エージェント導入を検討する際は、モデル選定より先に「cronが何をいつ回すか」「障害時にどのモデルへ逃がすか」を決めることが、40Bトークン規模の運用を支える土台になります。