xAIのAI画像・動画生成ツール「Grok Imagine」に、新たな制作モード「Agent Mode」がベータ版として追加されました。無限に広がるキャンバス上でAIエージェントと対話しながら、画像の生成・編集から動画の作成・結合までを一つの画面で完結できます。

この記事でわかること:

  • Agent Modeで何ができるのか
  • 従来のGrok Imagineとの違い
  • 利用方法と料金

Agent Modeとは何か

https://grok.com/imagine

2026年4月29日、xAIのクリエイティブアンバサダーであるDogan Ural氏がXで発表しました(参考)。Agent Modeは、Grok Imagineに搭載された新しいベータ機能です。最大の特徴は「無限キャンバス(infinite canvas)」の導入にあります。

従来のGrok Imagineでは、プロンプトを入力して画像や動画を1つずつ生成する直線的なワークフローでした。Agent Modeでは、制約のないキャンバス上にAIエージェントを配置し、ブレインストーミングしながら複数の素材を同時に扱えます。

主な機能

Agent Modeが提供する機能は大きく4つあります。

エージェントとのブレインストーミング

無限キャンバス上でAIエージェントとアイデアを練りながら制作を進められます。テキストで指示を出しつつ、生成結果を見ながら方向性を修正するという、対話型のクリエイティブワークフローです。

複数画像の同時生成・編集

1回の操作で複数の画像を同時に生成・編集できます。従来は1枚ずつ生成してバリエーションを確認する必要がありましたが、Agent Modeではキャンバス上で並行して作業できます。

画像から動画への変換と結合

生成した画像を動画に変換し、さらに複数の動画クリップをつなぎ合わせる機能があります。静止画のコンセプトアートを短編動画にまとめるといった使い方が考えられます。

動画の編集・エクスポート

トリム(不要部分のカット)、フェード(フェードイン・アウト効果)、クロップ(切り抜き)など基本的な動画編集をキャンバス上で行えます。完成した素材はそのままエクスポートできます。

従来モードとの違い

Grok Imagineには現在、用途に応じた複数のモードがあります。

Speedモードは生成速度を重視し、約10秒で画像を出力します。2026年4月に追加されたQualityモードは、xAIの最新画像生成モデルを使い、写実性やディテールを高めた4枚の画像を生成します。近日中に公開予定のProモードは、1080pの高解像度に対応する予定です。

これらのモードが「1つの素材をいかに高品質・高速に作るか」に焦点を当てているのに対し、Agent Modeは「複数の素材を組み合わせて1つの作品に仕上げるワークフロー全体」をカバーします。個別の画像生成ではなく、企画から完成品までの一気通貫が狙いです。

Grok Imagineの現在地

Grok Imagineは2025年10月にv0.9としてリリースされ、2026年2月にv1.0へアップデートされました。v1.0では動画の長さが最大10秒(SuperGrokユーザーは30秒まで延長可能)、解像度は720p、ネイティブオーディオの同時生成に対応しています。

月間の動画生成数は12億本を超えており、xAIの生成AIツールの中でも利用頻度が高いサービスです。コンポーネント機能では最大7枚の参照画像を「@」で役割指定でき、複数の被写体を1つのシーンにまとめることもできます。

今後はImagine 2.0のリリースも控えており、音声処理と顔・ディテールの一貫性が大幅に改善される見込みです。

利用方法と料金

Agent ModeはGrok Imagineのウェブアプリから利用できます。Grok自体は基本無料で使えますが、Imagineの高度な機能はX Premium以上のサブスクリプションが必要です。SuperGrokに加入すると、動画の長さ延長や高解像度出力など追加の機能が使えます。

現時点ではベータ版のため、一部のユーザーにはまだ表示されない場合があります。

まとめ

Agent Modeは、Grok Imagineを「画像・動画の生成ツール」から「AIと共同制作するクリエイティブ環境」へ拡張する試みです。無限キャンバス上で企画・生成・編集・エクスポートまでを完結できる設計は、ショート動画やSNSコンテンツの制作ワークフローを大きく変える可能性があります。ベータ版のため今後の機能追加や変更はありえますが、xAIが画像生成の先にある「制作体験」そのものに踏み込んだ点は注目に値します。