AIと会話するだけでアニメ短編が完成する。
Glifというクリエイティブエージェントに「アニメを作りたい」と伝えると、GPT-Image-2でストーリーボードを自動生成し、Seedance 2でそれをアニメ化するまでを一連の会話で完結できる。複数のツールを個別に操作する必要はない。
この記事でわかること:
- Glifがどんなクリエイティブエージェントなのか
- GPT-Image-2でストーリーボードを作り、Seedance 2でアニメ化する仕組み
- Seedance 2.0の主な特徴と利用できる場所
動画制作が「会話」で完結する
動画を作るには、アイデアをテキストに落とし、画像生成ツールで絵コンテを作り、それを別の動画生成ツールに投げ込む——複数ステップのツール操作が必要だった。各ツールのインターフェースを覚え、ファイルを手動で移動させる手間もある。
Glifはこのプロセスをまるごと引き受けるAIエージェントプラットフォームだ。
ユーザーがチャットで制作したいコンテンツを伝えると、裏側でGPT-Image-2やSeedance 2などのAIモデルを自動で選択・実行し、最終的な動画や画像を出力する。2026年4月にJustine Moore氏(@venturetwins)が投稿したデモでは、Glifに「アニメ短編を作りたい」と伝えるだけで、ストーリーボードの生成から動画のアニメ化まで一気通貫で完成した。「コントローラブルな動画生成をこんなに手軽に実現できる」と反響を呼んでいる。
ワークフローの仕組み:2ステップで動画を生成する
Glifが内部で行っているのは2つのAIモデルを順番に使う処理だ。
ステップ1:ストーリーボードの生成(GPT-Image-2)
まずGPT-Image-2を使い、シーンごとの絵コンテをグリッド形式で生成する。GPT-Image-2はOpenAIが提供する画像生成モデルで、テキストのレンダリング精度が高く、シーン内の文字や記号を正確に描画できる。1パネル=1ショットとして構成を視覚化でき、アニメ化前に内容を確認して修正することも可能だ。
ステップ2:アニメ化(Seedance 2)
生成したストーリーボードをSeedance 2に渡し、動画に変換する。グリッドの各パネルが1ショットとして解釈され、連続する映像として出力される。ショット間のつながりや動きの一貫性が保たれるため、手作業での編集なしに完結した映像になる。
Seedance 2.0の特徴
Seedance 2.0はByteDanceが開発した動画生成モデルで、2026年3月に中国向けJianying(剪映)でのリリースを皮切りに、同月26日にCapCutの一部マーケットへのローリングアウトを開始した。技術論文は2026年4月にarXivで公開されている(参考)。
主な特徴は次の通り。
マルチモーダル入力:テキスト・最大9枚の参照画像・3本の動画クリップ・3本の音声クリップを一度に受け取れる。ストーリーボードグリッドをそのまま渡すユースケースとの相性が高い。
音声の同時生成:音声は映像生成後に後付けするのではなく、映像と同時に生成される。8言語以上での口パク同期と空間音響(ステレオ・スペーシャル)に対応している。
カメラワーク:ドリーズーム、ラックフォーカス、トラッキングショット、POV切り替えなど映画的なカメラ移動が機能する。他モデルが苦手とする動きの多いシーンでも物理的な整合性を保てる。
出力仕様:4〜15秒のクリップを480p・720pで生成。アスペクト比は6種類に対応。
セーフティ制限として、実在人物の顔を含む画像からの動画生成はブロックされる。生成コンテンツには見えない透かし(ウォーターマーク)が埋め込まれ、二次流通時の権利管理に使われる。
グローバルでの利用はHiggsfield(ビジネスメール認証が必要。米国・日本は無制限)またはfal.ai(APIアクセス)から可能だ。CapCutでの展開はブラジル・インドネシア・マレーシア・メキシコ・フィリピン・タイ・ベトナムから順次拡大中で、日本での展開時期は未定となっている。
Glifで試すには
Glifは英語のチャットで操作するサービスで、フリーティアから利用できる。アカウント登録後、チャット画面に「I want to create an anime short」と入力するところから始められる。
類似ツールとして、HeyGenのVideo AgentもSeedance 2.0を内包しており、デジタルツインを使った動画生成が可能だ。ただしGlifはSeedance 2以外にも複数のモデルを内包し、Webコンテンツ・広告・ロゴ・アニメーションなど用途に応じて自動でモデルを切り替える点が異なる。アウトプットの種類を問わず「チャットだけで完結させる」ことに特化したプラットフォームと位置付けられる。
まとめ
動画制作のスキルセットが「ツールの操作方法を覚える」から「制作意図を言語化する」へ移行しつつある。GlifのGPT-Image-2+Seedance 2ワークフローはその変化を体験する入口として実用的な選択肢になっている。Seedance 2.0はfal.ai経由でAPIとしても利用できるため、同様のパイプラインを自前のアプリに組み込む実装も現実的だ。