「エージェントを本気で回すと、どれだけトークンを食うのか」——Henry Mascot氏が2026年6月25日に公開した運用実績は、この問いに具体的な数字で答えています。
この記事では、Mascot氏の個人エージェントチーム「Enterprise Crew」が年初から400億トークン(40B)を消費したという報告を軸に、オーケストレーター・コーディングエージェント・LLMの三層構成を整理します。
この記事でわかること
- Enterprise Crewが公開した運用規模とエージェント構成
- OpenClawとNousResearchを軸にしたオーケストレーションの役割分担
- Codex・Cursor・Claude Code・Droidを束ねるGeordiの位置づけ
- GPT-5.5を主力に、GeminiやMiniMaxなどをcron向けに使い分けるモデル戦略
https://x.com/iAmHenryMascot/status/2070215366467260592
400億トークン規模の個人エージェント運用
Mascot氏はX(旧Twitter)で「The Burn 🔥」と題し、Enterprise Crewが年初から40Bトークンを消費したと報告しました。Enterprise Crewは、Mascot氏が運用する個人向けのマルチエージェントチームです。Ada、Zora、Geordi、Scotty、Spockの5体が役割分担し、調査・コーディング・自動化などを担います。
40Bトークンは、チャットをたまに使うレベルとは桁が違います。OpenClawのcron(定期実行タスク)が24時間回り続け、複数モデルにジョブを振り分ける構成が前提です。Mascot氏はGitHub上で「本番運用で直面した課題を解くツール」として、Enterprise Crew Skillsを公開しており、model-orchestratorやself-healingなど、運用を支えるスキル群が揃っています。
オーケストレーター層:OpenClawとNousResearch
Mascot氏の投稿では、エージェント/オーケストレーターが4つと明記されています。そのうちOpenClawが1つ、NousResearch製のフレームワークが1つです。
OpenClawは、ローカルで動くパーソナルAIアシスタントのゲートウェイです。WhatsAppやSlackなど複数チャネルへのルーティング、cron、マルチエージェント分離、スキル管理を1つの制御面でまとめます。Enterprise Crewの基盤として、エージェントの起動・定期タスク・ツール連携を担います。
NousResearch側は、同社が2026年2月に公開したHermes Agentが該当します。Hermes Agentはタスク完了後にスキルファイルを自動生成し、次回以降の実行を高速化する「学習ループ」が特徴です。OpenClawがマルチチャネルとタスク管理のハブ、Hermesが深い推論とスキル蓄積を担う、という併用パターンはコミュニティでも語られています。Mascot氏は両方をオーケストレーターとして並列運用している形です。
コーディング層:Geordiと4つのハーネス
コード生成は「Geordi」と呼ばれるビルダーワークフローが担当します。Mascot氏の投稿では、GeordiがCodex、Cursor、CC(Claude Code)、Droidの4つをコーディングエージェントとして使い分けていると述べられています。
https://github.com/h-mascot/Enterprise-Crew-skills/tree/main/geordi
Geordiは、ゴールとPRD(製品要求仕様)のストーリーを登録し、選んだランタイムでミッションを実行するミッションランナーです。geordi run --mode codexでCodexを、--mode cursorでCursor CLIを、--mode claudeでClaude Codeを、--mode droidでFactory Droidを起動します。実装と検証を分離し、ログとgitのレシートを残す設計です。
4つのハーネスは、Agent Client Protocol(ACP)経由でOpenClawからルーティングできます。OpenClawのacpx拡張では、Codex、Cursor、Gemini CLI、Droid、Kimi CLIなどが標準エージェントとして登録されています。Geordiはその上に、PRD駆動の反復ビルドループを載せる役割を持ちます。同リポジトリのralphスキルは、CodexやClaude Codeを繰り返し起動してPRD項目をすべて完了するまで回す自律コーディングループです。
モデル層:GPT-5.5主力とcron向けマルチモデル
対話や推論の主力モデルはGPT-5.5(high推論モード)です。OpenAIは2026年4月23日にGPT-5.5を公開し、エージェント的コーディングやツール連携に強いフロンティアモデルと位置づけています。reasoning.effortにlowからxhighまでの段階があり、highは複雑なエージェントタスク向けの設定です。
一方、cronやループ処理にはGemini、Kimi、GLM、MiniMaxなど複数モデルを使い分けます。Enterprise Crew Skillsのmodel-orchestratorは、タスクの複雑度に応じて3段階のティアに分類し、プロバイダーの健全性・クォータ・コストでルーティングします。
| ティア | タスク例 | 優先モデル |
|---|---|---|
| T1(単純) | ハートビート、ディスクチェック | MiniMax → Gemini Flash → Kimi |
| T2(中程度) | メール仕分け、通知ルーティング | Gemini Flash → Kimi → MiniMax |
| T3(複雑) | 調査統合、ブログ執筆 | Opus → Sonnet → Kimi → Gemini Flash |
6時間ごとにオーケストレーションを回し、2つ以上のプロバイダーがダウンした場合はクリシスモードで重要cronだけを維持します。Z.ai(GLM)のクォータエラーと残高切れを区別するなど、実運用で起きる課題への対処も組み込まれています。
実務に活かせる設計のポイント
Enterprise Crewの構成から読み取れるのは、「1つの最強モデルに全部任せない」という設計思想です。
オーケストレーターはOpenClawでタスク管理とチャネル統合を担い、NousResearchのHermesでスキル蓄積を補完します。コーディングはGeordiがCodex・Cursor・Claude Code・Droidを状況に応じて切り替えます。モデル選択は、対話品質が必要な場面ではGPT-5.5 high、定期ジョブでは安価なモデルやクォータに余裕のあるプロバイダーへ振り分けます。
Mascot氏はGitHubでsession-cleaner(セッション整理)、council(分野別マルチエージェント討議)、self-healing(チェックポイントとフォールバック)など、運用で実際に使ったスキルを公開しています。エージェント導入を検討する際は、モデル選定より先に「cronが何をいつ回すか」「障害時にどのモデルへ逃がすか」を決めることが、40Bトークン規模の運用を支える土台になります。