エージェントを本番運用するには、モデル呼び出し以外にサンドボックス、ツール実行、認証、セッション管理が必要です。Anthropicは2026年4月8日にClaude Managed Agentsをパブリックベータで公開し、これらの基盤をAPIとして提供し始めました。2026年6月2日の公式デモでは、仕様書(Spec)を起点にエージェントがツールを選び、実装からマージ可能なPRまでを一気通貫で進める流れが初めて公開されています。

この記事では、デモで示されたワークフローと、公式ドキュメントに基づく仕組み・料金・導入条件を整理します。

この記事でわかること

  • Claude Managed Agentsが解く課題と、Messages APIとの違い
  • Spec起点でPRまで進めるデモの流れ(2026年6月時点)
  • Agent・Environment・Sessionの構成とMCP連携の要点
  • 料金体系とベータ利用時の注意点

なぜ今「実行基盤」が別製品になったのか

これまで多くのチームは、Claude APIのMessages APIでプロンプトを送り、ツール呼び出しのループを自前実装していました。停止理由の判定、ツール結果の返却、サンドボックスの確保、長時間タスクの状態保持まで、アプリ側のコード量が膨らみます。Anthropicのエンジニアリングブログでも、ハーネス(エージェント実行の枠組み)に埋め込んだ「モデルがまだできない」という前提は、モデル改善とともに古くなりやすいと説明されています(参考)。

Claude Managed Agentsは、この実行レイヤーをホスト側に移すサービスです。公式概要では「エージェントループ、ツール実行、ランタイムを自前で組む必要がない」と位置づけられ、ファイル操作、シェル実行、Web検索、MCP経由の外部連携を安全なサンドボックス内で行います。2026年4月8日のリリースノートでパブリックベータ入りし、全エンドポイントにmanaged-agents-2026-04-01ベータヘッダが必須です(リリースノート)。

6月のデモが示した「Spec→ツール選択→PR」

今回のネタ元は、カーラ・アルボレダス氏が2026年6月2日に投稿したXの速報です。同投稿によると、AnthropicエンジニアがステージでClaude Managed Agentsの初のウォークスルーを行い、次の流れが紹介されたとされています。

  • Spec:仕様を起点にタスクを渡す
  • エージェントがツールを選択:必要な能力を実行時に判断
  • 端から端まで実行:実装・検証までをセッション内で完結
  • 朝にはマージ可能なPR:GitHub連携でプルリクエストまで到達

デモでは「四半期分の作業が数時間で終わる」というエンジニアの言葉が引用され、Claude Opus 4.7、Managed Agents、MCPの組み合わせが強調されています。所要は約29分との記載もあります。これは第三者によるイベント速報であり、再現手順や社内検証データの公開ではありません。ただし、公式GitHub連携ドキュメントが示す能力と整合します。リポジトリをセッションにマウントし、GitHub MCPでブランチ作成・コミット・プッシュまで任せる設計が既に文書化されています(GitHub連携)。

4つの概念で理解するアーキテクチャ

Managed Agentsは次の4要素で構成されます(概要ドキュメント)。

概念 役割
Agent モデル、システムプロンプト、ツール、MCPサーバー、Skillsを束ねた再利用可能な定義
Environment セッションが動く場所(Anthropic管理のクラウド、または自前ホスト)
Session 特定タスクを実行するエージェントインスタンス
Events ユーザーメッセージ、ツール結果、ステータス更新などのやり取り

Agentは一度定義してIDで参照します。モデルはClaude 4.5系以降が対象で、エージェント作成時にagent_toolset_20260401を付与すると、bash、ファイル操作、Web検索・取得などのプリビルトツール一式が使えます。Session開始時にGitHubリポジトリをresourcesとしてマウントし、MCPの認証はAgent定義ではなくVault(認証情報の保管庫)でセッション作成時に紐づけます。トークンをAgent JSONに直書きしない設計で、漏えいリスクを下げています(MCPコネクタ)。

ユーザーはEvents APIで指示を送り、応答はSSE(Server-Sent Events)でストリーム受信します。実行中に追加のユーザーメッセージで軌道修正したり、中断して方向転換したりできます。

Messages APIとの使い分け

観点 Messages API Claude Managed Agents
制御 プロンプトとツールループを自前実装 ハーネスとインフラをAnthropicが提供
向く用途 細かい制御、独自フロー 数分〜数時間の自律タスク、非同期処理
状態 アプリ側で保持 会話履歴・サンドボックス状態をサーバー側で保持

「モデルを叩くだけ」から「エージェントを動かす製品」へレイヤーが分かれた、という整理ができます。Claude Opus 4.7は2026年4月16日にエージェント向けコーディング用途で強化され、Managed Agents利用時はMessages API向けの一部破壊的変更の影響を受けないと公式に説明されています(Opus 4.7の新機能)。デモで4.7が使われたのは、この文脈と一致します。

料金と導入の前提

料金はトークン課金セッションランタイム課金の二軸です。ランタイムはセッションがrunning状態の時間に対し、1セッション時間あたり0.08ドル(時間単価、ミリ秒単位で計測)が加算されます。idleterminated中はカウントされません(料金)。公式の計算例では、Opus 4.7で1時間のコーディングセッション(入力5万・出力1.5万トークン)の合計が約0.705ドルとされています。

利用にはClaude APIキーが必要で、Claude Pro/Maxなどのチャット契約とは別です。パブリックベータはデフォルトでAPIアカウントに有効とされています。一方、セッションはステートフルなため、現時点ではZero Data RetentionやHIPAA BAAの対象外です。データはAPI経由でセッション単位に削除できます。

2026年5月以降、マルチエージェントセッション、Outcomes(成功条件に向けた反復)、Webhook、セルフホストサンドボックスなどが順次拡張されています。MCPトンネルやdreamingは研究プレビューで、別途アクセス申請が必要です。

開発チームが取るべき第一歩

デモが印象的なのは、仕様を渡せば実装とPRまで進むという一連の流れです。自社で再現する場合、まず小さなAgent定義(モデル、システムプロンプト、agent_toolset_20260401)を作り、テスト用リポジトリをマウントしたSessionで「型エラー修正→ブランチ→プッシュ」程度のタスクから試すのが現実的です。GitHubトークンは最小権限のfine-grained PATを推奨する公式ガイドに沿ってください。

本番投入前に確認すべきは次の三点です。長時間実行時のトークンとランタイムコスト、Vault運用(MCP認証のローテーション)、データ保持ポリシーとの整合です。Messages APIで十分な短い応答生成と、Managed Agentsで担うべき長期自律タスクを分ければ、過剰なインフラ投資を避けられます。

エージェント開発のボトルネックは、もはや「プロンプトの質」だけではありません。実行環境とツール統合を誰が持つかが製品設計の分岐点になり、Anthropicはその回答をAPIとして出し始めています。SpecからPRまでを一本のセッションに載せられるかどうかは、自社のリポジトリ権限とタスク粒度次第です。公式クイックスタートで最初のSessionを流し、自チームのワークロードに合うかを測るのが近道です(クイックスタート)。