画像生成AIで「動画」が作れる。

GPT Image 2は画像生成モデルですが、フレームを少しずつ変化させて連続生成し、GIFに変換すれば、コマ撮り(ストップモーション)動画になります。専用の動画生成AIを使わず、ChatGPTの会話だけで完結する方法です。

この記事でわかること:

  • GPT Image 2をコマ撮り動画に使う仕組み
  • ChatGPTでフレームを生成しGIFに変換する具体的な手順
  • 動きの一貫性を保つプロンプトのコツ
  • 専用の動画生成AIとの使い分け

コマ撮り動画とGPT Image 2の相性

https://openai.com/index/introducing-chatgpt-images-2-0/

GPT Image 2は2026年4月21日にOpenAIがリリースした画像生成モデルです。前世代のDALL-E 3と比べ、テキスト描画精度が約99%に向上し、1枚の画像に100以上のオブジェクトを配置できます。

コマ撮り動画と相性が良い理由は、マルチターン編集に対応している点です。マルチターン編集とは、ChatGPTの会話内で前の画像を参照しながら次の画像を生成する機能を指します。キャラクターの外見や背景のスタイルが大きく崩れないため、連続フレームの生成に適しています。

動画生成AIが「連続した映像」を一括で出力するのに対し、GPT Image 2は静止画を1枚ずつコントロールしながら作ります。フレーム単位で構図や動きを細かく指定できる点が、この方法の強みです。

必要な環境

  • ChatGPTアカウント(無料プランでもGPT Image 2を利用可能)
  • 有料プラン(Plus/Pro)では画像生成の回数上限が増える

無料プランでも試せます。ただしフレーム数が多いストップモーションでは回数制限に達しやすいため、有料プランの方が実用的です。

フレーム生成からGIF変換までの手順

最初のフレームを生成する

ChatGPTに最初のフレームを指示します。ストップモーション用であることを明示し、画像のアスペクト比も指定します。

プロンプト例:「ストップモーションアニメーション用の画像を生成してください。正方形で、白い背景に赤いボールが左端の地面に置かれている場面です。まず最初のフレームだけ生成してください」

「最初の1枚だけ」と指示するのがポイントです。これを省くと、ChatGPTが一度に全フレームを1枚の画像にまとめて出力する場合があります。

連続フレームを1枚ずつ生成する

最初のフレームを確認したら、次のフレームを指示します。前のフレームから「何が変わるか」を具体的に伝えます。

プロンプト例:「次のフレームを生成してください。ボールが少し右に転がり、わずかに跳ね上がっています。背景とスタイルは前のフレームと同じに保ってください」

この操作を5〜10回繰り返します。1フレームあたりの動きは小さく抑えます。大きく動かすと不自然な飛びが生じます。

フレームをGIFに変換する

全フレームが揃ったら、ChatGPTのCode Interpreter(Python実行環境)でGIFに変換します。

プロンプト例:「生成した画像をすべて使って、0.3秒間隔のアニメーションGIFを作成してください。ループ再生で、バウンス効果(往復再生)をつけてください」

ChatGPTがPythonコードを自動実行し、GIFファイルをダウンロード可能な形で出力します。バウンス効果を指定すると、フレームを順再生→逆再生の順で繰り返すため、少ないフレーム数でも自然なループになります。

クオリティを上げるプロンプトのコツ

フレーム間の一貫性が、コマ撮り動画の品質を左右します。

スタイルを固定する指示を毎回入れる。 「前のフレームと同じスタイル・背景・色調で」と追加します。GPT Image 2のマルチターン編集のおかげでスタイルが大きく崩れることは少ないですが、明示的に指定した方が安定します。

1フレームの変化量を「少し」「わずかに」に留める。 10枚のフレームで1つのアクションを完結させるイメージで分量を調整します。フレームあたりの変化が大きいと、コマ撮り特有の滑らかな動きが失われます。

フレーム数は5〜10枚が実用的。 枚数が増えると生成回数の制限に達しやすくなります。後半のフレームほどスタイルのずれが蓄積するリスクも上がるため、最初は少ない枚数で試すのが効率的です。

動画生成AIとの使い分け

Sora 2やKling 3.0などの動画生成AIは、1つのプロンプトから連続した映像を出力します。物理演算に基づく自然な動き、水や布のシミュレーション、カメラワークの制御が必要な場面はこちらが適しています。

一方、GPT Image 2のコマ撮り方式は以下の用途に向いています。

  • 製品の組み立て手順や操作ガイドなど、各ステップを正確に描写したい場面
  • キャラクターのポーズを1枚ずつ指定するアニメーション
  • SNS向けの短いループGIF

動画生成AIは「映像全体の自然さ」を優先し、コマ撮り方式は「各フレームの正確さ」を優先します。目的に応じて選び分けると効率的です。

次に試すこと

まずは5枚程度のフレームで短いループGIFを作ってみてください。ChatGPTの無料プランでも試せます。コツをつかんだら、フレーム数を増やしたり、生成したフレームをSora 2やKlingに渡してより滑らかな動画に仕上げるワークフローも検討できます。