マルチエージェントの協調設計は、中央オーケストレーターに依存しがちです。ハーバード大学などの研究チームが発表した「Economy of Minds(EoM)」は、この前提を覆します。オークション、入札、財布(wealth)という市場メカニズムで、複数エージェントのプロンプトを同時に最適化する新手法です。

この記事では、EoMの仕組みと実験結果、従来のプロンプト最適化との違いを整理します。

  • EoMが解決するマルチエージェント設計の課題
  • オークションと取引による分散型クレジット割り当ての仕組み
  • 5つのベンチマークでの性能改善とアブレーション結果
  • 既存の単一プロンプト最適化や中央制御型MASとの違い

中央制御なしでエージェント群を進化させる発想

マルチエージェントシステム(MAS)は、複数のLLM(大規模言語モデル)エージェントが役割分担してタスクをこなす構成です。従来は「誰がいつ何をするか」を開発者がプロンプトとワークフローで手設計するか、中央のオーケストレーターが全体を指揮します。

この方式には2つの弱点があります。計画が1つの制御ゲートに集中し、ボトルネックと単一障害点になります。エージェント数が増えるほど、中央制御の学習・適応コストも膨らみます。

EoMは、経済学者フリードリヒ・ハイエクの「価格が分散した知識を調整する」という考え方に着想を得ています(論文)。中央管理者の代わりに、エージェント同士が市場のように競争・取引し、成功した行動パターンが自然に残る設計です。2026年6月、X(旧Twitter)のRoundtableSpaceアカウントがこの研究を紹介し、「プロンプト同士が交渉する市場モデル」として話題になりました(参考)。

EoMの2つのプロセス

https://zhentingqi.github.io/internal/projects/EoM/

EoMは「タスク内の計画」と「タスク間の適応」の2段階で動きます。

計画(Planning)は1つのタスク実行中に行われます。各エージェントは起動条件(wake-up condition)を満たすと入札に参加し、最も高い入札額を提示したエージェントが行動権を獲得します。勝者は直前に行動したエージェントへ入札額を支払い、環境からの報酬を受け取ります。この「バケツリレー型」の取引により、後続エージェントが高く評価する行動を取ったエージェントに富が流れ、中央の評価者なしでクレジット割り当てが行われます。

適応(Adaptation)はタスク間で行われます。富を蓄積したエージェントはプロンプトを変異させて子エージェントを生み(exploitation)、破産したエージェントはプロンプトを修正した新エージェントに置き換わります(exploration)。全エージェントは定期的に家賃(rent)を支払い、富がマイナスになった個体は淘汰されます。プロンプト生成オペレーターが、成功したエージェントの変異と失敗したエージェントの修正を担います。

各エージェントは起動条件と行動方針の2種類のシステムプロンプトを持ち、同一の凍結されたLLMバックボーン上で動作します。入札額は導入時に固定され、新規エージェントは初回オークションで必ず1度は行動できるよう、競合の最高入札額をわずかに上回る額が設定されます。

5領域で弱いエージェント群が単一エージェントを上回る

研究チームはEoMを5つのエージェントタスクで検証しました。数学推論(MATH)、金融調査(Finance-Agent-Bench)、科学研究(FrontierScience-Research)、アクセラレータ設計(Gemmini)、分散システム最適化(CloudCast)です。いずれも個別エージェントはツール1つだけ、出力トークン制限、専門ロールなど意図的に能力を制限した「部分エージェント」からスタートします。

結果は一貫して単一の完全エージェントを上回りました。MATHではLlama-3.1-8Bベースの精度が15.9%から57.0%に改善し、同一バックボーンの完全エージェント(51.9%)を超えています。Gemma-2-9Bでも4.2%から45.1%へ上がり、完全エージェントの44.3%を上回りました。金融調査では30タスクの訓練で45.0%から60.0%に到達し、マルチエージェント討論(50.0%)やReAct(45.0%)を上回りました。CloudCastでは最良コストが657に対し、OpenEvolveは930でした。アクセラレータ設計では平均EDP(エネルギー遅延積)が39.3となり、ドメイン特化手法DOSAの80.2を大きく下回りました。

アブレーション実験では、オークションや探索・活用のいずれかを外すと性能が低下します。Finance-Agent-Benchで探索を無効化すると平均精度が26.0%まで落ち、複数エージェントを並べるだけでは不十分であることが示されています。

従来のプロンプト最適化との違い

既存のプロンプト最適化は、多くが単一プロンプトの反復改善に留まります。MASPOやMAPGDなどの近年手法は、エージェント間の依存関係を考慮した共同最適化を目指しますが、中央の評価関数やビームサーチによる探索が中心です。

EoMの特徴は、プロンプト最適化を市場シミュレーションそのものに組み込んでいる点です。エージェントは明示的な通信プロトコルや固定ワークフローを持たず、入札競争と富の移転だけで行動順序と役割分担が決まります。Neural Breakdownの解説でも「単一プロンプトではなく、オークション・入札・財布でマルチエージェントのプロンプトシステムを最適化する」と紹介されています(参考)。

実装はGitHubのzhentingqi/EoMで公開されています。hayekmas/base/にオークション・訓練・評価エンジンがあり、cloudcastresearchworldarch_dse_worldの3アダプタで各タスクを実行できます。設定JSONを指定してpython main.py global_configs/train_cloudcast.jsonのように起動します。

設計者が意識すべき点

EoMは「協調を設計する」のではなく「インセンティブを設計する」アプローチです。家賃や報酬のバランスを変えると性能が大きく変わるため、ドメインごとのチューニングが必要です。訓練初期は探索による一時的な性能低下も見られ、金融タスクでは45.0%から一度下がってから60.0%に回復する非単調な軌跡が報告されています。

また、市場メカニズムをLLMエージェントに適用する研究は、暗黙の価格協調(アルゴリズム的カルテル)のリスクも指摘されています。EoMはタスク達成のための協調設計が主目的ですが、経済的インセンティブを導入するMAS全般に共通する設計上の留意点として認識しておく価値があります。

マルチエージェント設計のボトルネックが「誰がいつ動くか」の手動設計にあるなら、EoMは市場原理でその問題に切り込む選択肢です。中央オーケストレーターなしに、プロンプトの進化と行動連鎖の最適化を同時に進められる点が、2026年のMAS研究における注目ポイントです。