AIと会話するだけでアニメ短編が完成する。

Glifというクリエイティブエージェントに「アニメを作りたい」と伝えると、GPT-Image-2でストーリーボードを自動生成し、Seedance 2でそれをアニメ化するまでを一連の会話で完結できる。複数のツールを個別に操作する必要はない。

この記事でわかること:

  • Glifがどんなクリエイティブエージェントなのか
  • GPT-Image-2でストーリーボードを作り、Seedance 2でアニメ化する仕組み
  • Seedance 2.0の主な特徴と利用できる場所

動画制作が「会話」で完結する

動画を作るには、アイデアをテキストに落とし、画像生成ツールで絵コンテを作り、それを別の動画生成ツールに投げ込む——複数ステップのツール操作が必要だった。各ツールのインターフェースを覚え、ファイルを手動で移動させる手間もある。

Glifはこのプロセスをまるごと引き受けるAIエージェントプラットフォームだ。

ユーザーがチャットで制作したいコンテンツを伝えると、裏側でGPT-Image-2やSeedance 2などのAIモデルを自動で選択・実行し、最終的な動画や画像を出力する。2026年4月にJustine Moore氏(@venturetwins)が投稿したデモでは、Glifに「アニメ短編を作りたい」と伝えるだけで、ストーリーボードの生成から動画のアニメ化まで一気通貫で完成した。「コントローラブルな動画生成をこんなに手軽に実現できる」と反響を呼んでいる。

ワークフローの仕組み:2ステップで動画を生成する

Glifが内部で行っているのは2つのAIモデルを順番に使う処理だ。

ステップ1:ストーリーボードの生成(GPT-Image-2)

まずGPT-Image-2を使い、シーンごとの絵コンテをグリッド形式で生成する。GPT-Image-2はOpenAIが提供する画像生成モデルで、テキストのレンダリング精度が高く、シーン内の文字や記号を正確に描画できる。1パネル=1ショットとして構成を視覚化でき、アニメ化前に内容を確認して修正することも可能だ。

ステップ2:アニメ化(Seedance 2)

生成したストーリーボードをSeedance 2に渡し、動画に変換する。グリッドの各パネルが1ショットとして解釈され、連続する映像として出力される。ショット間のつながりや動きの一貫性が保たれるため、手作業での編集なしに完結した映像になる。

Seedance 2.0の特徴

Seedance 2.0はByteDanceが開発した動画生成モデルで、2026年3月に中国向けJianying(剪映)でのリリースを皮切りに、同月26日にCapCutの一部マーケットへのローリングアウトを開始した。技術論文は2026年4月にarXivで公開されている(参考)。

主な特徴は次の通り。

マルチモーダル入力:テキスト・最大9枚の参照画像・3本の動画クリップ・3本の音声クリップを一度に受け取れる。ストーリーボードグリッドをそのまま渡すユースケースとの相性が高い。

音声の同時生成:音声は映像生成後に後付けするのではなく、映像と同時に生成される。8言語以上での口パク同期と空間音響(ステレオ・スペーシャル)に対応している。

カメラワーク:ドリーズーム、ラックフォーカス、トラッキングショット、POV切り替えなど映画的なカメラ移動が機能する。他モデルが苦手とする動きの多いシーンでも物理的な整合性を保てる。

出力仕様:4〜15秒のクリップを480p・720pで生成。アスペクト比は6種類に対応。

セーフティ制限として、実在人物の顔を含む画像からの動画生成はブロックされる。生成コンテンツには見えない透かし(ウォーターマーク)が埋め込まれ、二次流通時の権利管理に使われる。

グローバルでの利用はHiggsfield(ビジネスメール認証が必要。米国・日本は無制限)またはfal.ai(APIアクセス)から可能だ。CapCutでの展開はブラジル・インドネシア・マレーシア・メキシコ・フィリピン・タイ・ベトナムから順次拡大中で、日本での展開時期は未定となっている。

Glifで試すには

Glifは英語のチャットで操作するサービスで、フリーティアから利用できる。アカウント登録後、チャット画面に「I want to create an anime short」と入力するところから始められる。

類似ツールとして、HeyGenのVideo AgentもSeedance 2.0を内包しており、デジタルツインを使った動画生成が可能だ。ただしGlifはSeedance 2以外にも複数のモデルを内包し、Webコンテンツ・広告・ロゴ・アニメーションなど用途に応じて自動でモデルを切り替える点が異なる。アウトプットの種類を問わず「チャットだけで完結させる」ことに特化したプラットフォームと位置付けられる。

まとめ

動画制作のスキルセットが「ツールの操作方法を覚える」から「制作意図を言語化する」へ移行しつつある。GlifのGPT-Image-2+Seedance 2ワークフローはその変化を体験する入口として実用的な選択肢になっている。Seedance 2.0はfal.ai経由でAPIとしても利用できるため、同様のパイプラインを自前のアプリに組み込む実装も現実的だ。