四半期規模の移行を、数日で終わらせる——Anthropicがその前提を現実に近づけました。

2026年5月28日、Anthropicは最上位モデル Claude Opus 4.8 を全チャネルで提供開始しました。同時に、Claude Code向けの Dynamic workflows(研究プレビュー)が追加され、1セッションで最大1,000のサブエージェントを並列編成できます。料金はOpus 4.7と同額のまま据え置きです。

この記事でわかること

  • Opus 4.8で何が変わったか(モデル・API・料金)
  • Dynamic workflowsの仕組みと使い方
  • サブエージェント・Skills・Agent teamsとの違い
  • 利用時の制限とコスト上の注意点

Opus 4.8で変わったこと

大規模なコード移行や長時間のエージェント作業では、モデルの推論力と「嘘を通さない正直さ」の両方がボトルネックになります。Opus 4.8は、Opus 4.7をベースにベンチマークと協働性を底上げしたアップグレード版です。

公式発表によると、コードの欠陥を指摘せず通過させる確率はOpus 4.7のおよそ4分の1に減っています。コーディング・エージェント・推論・実務知識の各タスクで、Opus 4.7や他モデルとの比較表も公開されています。

APIのモデルIDは claude-opus-4-8 です。入力は$5/MTok、出力は$25/MTokで、Opus 4.7と同じ価格です。claude.ai、Claude API、Amazon Bedrock、Vertex AI、Microsoft Foundryで利用できます。コンテキストは最大100万トークン(Foundryは20万)、最大出力は128kトークンです。

Fast modeとEffort制御

応答速度と思考の深さを、用途に合わせて切り替えられるようになりました。

Fast modeは従来モデル比で2.5倍速です。料金は入力$10/MTok・出力$50/MTokで、従来のFast modeより3倍安くなっています。品質重視の通常モードと、速度・コスト重視のFast modeを使い分けやすくなりました。

Effort controlはclaude.aiとCoworkに追加されたコントロールで、思考の深さと頻度を選べます。Opus 4.8のデフォルトは high です。難しいタスクや長時間の非同期ワークフローでは、Claude Codeでは xhighmax の利用が推奨されています。

Dynamic workflowsとは

数千ファイルのマイグレーションや、コードベース全体のセキュリティ監査では、1体のエージェントでは並列度と検証の幅が足りません。Dynamic workflowsは、Claudeがタスク用の JavaScriptオーケストレーションスクリプト を動的に書き、数十〜数百のサブエージェントを並列実行する仕組みです。

各エージェントが独立した角度で作業し、他エージェントが結果を反証(adversarial)します。収束するまで反復し、検証済みの結果だけをユーザーに返します。実行は数時間から数日かかることもあり、進捗は保存されるため 同一セッション内 で中断後に再開できます。

内部事例:BunのZig→Rust移植

Bun開発のJarred Sumner氏は、Dynamic workflowsでZigからRustへの移植を実施しました。公式ブログによると、既存テストの99.8%がパスし、約75万行のRustコードを、初コミットからマージまで約11日で完了しています(ブログ公開時点では本番未投入)。

使い方と要件

Claude Code v2.1.154以降 が必要です。対応面はCLI、Desktop、VS Code拡張です。Max・Team・Enterpriseが対象で、Proは /config からDynamic workflowsを有効化します。

開始方法は主に次の2通りです。

  1. プロンプトで直接依頼する(例:「Create a workflow」)
  2. ultracode 設定——effortをxhighにし、タスクに応じてClaudeが自動でworkflowを選択

v2.1.160以降は「use a workflow」などの自然言語でも起動できます。セッション全体で自動化する場合は /effort ultracode を使います。複数角度のWeb調査には /deep-research コマンドも用意されています。Dynamic workflows利用時は auto modeをオン にするのが推奨です。

既存機能との違い

Claude Codeには、サブエージェント・Skills・Agent teamsなど、複数の並列化手段があります。違いは次のとおりです。

方式 オーケストレータ スケール
Subagents / Skills Claude(ターンごと) ターンあたり数件
Agent teams リードエージェント 少数の長時間ピア
Workflows スクリプト 1実行あたり数十〜数百(最大1,000)

Workflowsは中間結果をスクリプト変数に保持し、会話のコンテキストを圧迫しません。調整は会話外で行われるため、タスクが大きくなっても計画が維持されます。

制限とコストの注意点

同時に動くエージェントは 最大16 です(CPUコア数により更少)。1実行あたりに起動できるエージェント総数の上限は 1,000 です。workflow実行中は通常のユーザー入力は不可で、許可プロンプトでの一時停止のみ可能です。

1 workflowは多数のエージェントを起動するため、通常の会話セッションより 大幅に多いトークン を消費します。公式は大規模タスクの前に小さなスコープで試すことを推奨しています。使用量は /workflows でエージェントごとに確認できます。初回トリガー時には実行内容の確認プロンプトが表示されます。

Enterpriseではローンチ時デフォルトでオフです。管理者がClaude Code設定から有効化する必要があります。無効化は /configdisableWorkflows 設定、環境変数 CLAUDE_CODE_DISABLE_WORKFLOWS=1 でも可能です。

Messages APIのsystemエントリ

エージェント開発者向けに、Messages APIが messages 配列内のsystemエントリを受け付けるようになりました。エージェント実行中にプロンプトキャッシュを壊さず、権限・トークン予算・環境コンテキストをミッドタスクで更新できます。長時間ワークフローとAPI連携の組み合わせに効きます。

ベンチマークで見える位置づけ

ターミナル操作ベンチマーク Terminal-Bench 2.1 では、公開ハーネスTerminus-2でOpus 4.8は 74.6% です。同条件のGPT-5.5は78.2%、Opus 4.7は66.1%でした。GPT-5.5の83.4%はCodex CLI独自ハーネスでの数値であり、ハーネスが違えば順位も変わります(参考)。

ブラウザ操作の Online-Mind2Web では84%と、The Browser Companyの評価でOpus 4.7やGPT-5.5を大きく上回る結果が出ています。Super-Agent benchmarkではOpus 4.8のみが全ケースをエンドツーエンド完了したとAnthropicは報告しています。

開発者が今すぐ試すなら

Opus 4.8は料金据え置きで、正直性とエージェント性能が底上げされています。大規模リポジトリの移行や監査をClaude Codeで回すなら、Dynamic workflowsと /effort ultracode の組み合わせが現実的な入口です。まずは小さなスコープでworkflowを走らせ、トークン消費を /workflows で確認してから本番タスクに広げる流れが安全です。