コンテンツ制作の手間がまた一段と減りました。
ElevenLabsが2026年5月7日、ElevenCreativeのStudioにAI共同編集者「Studio Agent」を追加しました。これまで手動で進めていたスクリプト生成、声の選択、効果音の配置、クリップの組み立てを、アイデアを伝えるだけでAIが一括処理します。
この記事でわかること:
- Studio Agentが解決する制作フローの課題
- Studio AgentにできることとStudio 3.0の手動編集との違い
- 実際の使い方と途中から手動に切り替える方法
- 料金プランと対象ユーザー
これまでのStudioと制作フローの課題
Studio 3.0はElevenCreativeのメイン機能で、音声・音楽・効果音・動画を1つのタイムライン上で扱えるブラウザ型エディタです。ナレーション生成、Eleven Musicによる楽曲生成、SFX V2による効果音配置、29言語対応の自動キャプションなど、AI音声制作の主要機能が一通り揃っています。ElevenLabsによると、2026年5月時点でStudioを含むElevenCreativeの年間経常収益は5億ドルに達しています。
ただし、これまでの制作フローは「手動組み立て」が前提でした。スクリプトを書き、声を選び、効果音のタイミングを決め、クリップをタイムラインに並べる——各ステップは個別にAIが補助するものの、全体の段取りはユーザーが決める必要がありました。クリエイターやマーケターが短い動画を1本仕上げるにも、複数の設定画面を行き来する手間が伴っていました。
Studio Agentができること
Studio Agentは、この段取りの手間をなくすために追加されたAI共同編集者です。
ユーザーはアイデアをテキストで伝えるだけで構いません。Studio Agentはその内容からスクリプトを自動生成し、内容に合った声を選んで、効果音をタイムラインの適切な位置に配置し、クリップを組み立てて全体の構成をまとめます。
Agentによるドラフトが出来上がったあとはいつでも追加指示を出して修正を依頼できます。あるいは、タイムラインの手動編集モードに切り替えて、細部を自分で調整することも可能です。完全な自動化と詳細な手動制御を、同じプロジェクト内で使い分けられる設計です。
Studio 3.0の手動編集との違い
Studio 3.0はもともと「設定のハードルが低い音声制作環境」として設計されています。テキストを修正するだけで対応箇所の音声が再生成され、各トラックをタイムライン上で独立して編集できます。AIによるノイズ除去(平均24dBの低減)、チームコラボレーション機能なども備えています。
Descript(文字起こし軸の動画編集)やAdobe Premiere Pro(プロ向け映像編集)と比べると、ElevenLabs Studioは「AIによる音声・音楽・効果音の生成」をコアとした設計が特徴です。Studio Agentが加わったことで、制作経験が浅いマーケターや、量産が必要なコンテンツチームにとっても、アイデアをすぐにコンテンツへ変換できる入口が生まれました。
料金と利用方法
Studio 3.0はFreeプランから利用できます。商用利用にはStarterプラン(月額5ドル)以上が必要です。
| プラン | 月額 | プロジェクト数 | 主な特徴 |
|---|---|---|---|
| Free | $0 | 3件 | 基本生成、動画インポート、自動キャプション |
| Starter | $5 | 20件 | 商用利用可、インスタント音声クローン |
| Creator | $22 | 無制限 | 上位制限、プロ音声クローン |
| Pro | $99 | 無制限 | 優先処理、44.1kHz PCM API |
Studio Agentの利用は、ElevenLabs公式サイトのStudioページから開始できます。Freeプランでもアクセス可能な見込みですが、生成上限は各プランの制限に準じます。
まとめ
Studio Agentは、ElevenLabs Studioの使い方を「ツールを操作して作る」から「アイデアを伝えて完成させる」に変えるアップデートです。スクリプト生成から効果音配置まで会話ベースで進め、必要に応じて手動に切り替えるアプローチは、音声コンテンツ制作の入口を広げます。
Freelanceのクリエイターから企業のコンテンツチームまで、制作ボリュームが大きいほど恩恵が出やすい機能といえます。