自分の顔と声をそのまま動画に載せられる時代が、Geminiアプリで現実になりました。

Googleは2026年6月初旬、GeminiアプリのAvatar機能を有料購読者へより広く展開し始めたとAndroid Authorityが報じています。I/O 2026で発表された機能が、約2週間後に利用者の手元へ届き始めた段階です。この記事では、Avatarの概要からセットアップ手順、利用条件、Google Vidsのアバターとの違いまで整理します。

この記事でわかること

  • Avatar機能で何ができるか
  • 顔と声を登録して動画を作る手順
  • 利用に必要なプランと地域制限
  • ディープフェイク対策としてのSynthID

Avatar機能とは何か

Avatarは、Geminiアプリ上でユーザーの顔と声を登録し、自分そっくりのデジタルクローンを動画コンテンツに出演させる機能です。Google公式ヘルプでは「自分の見た目と声で動画を生成できるデジタル版の自分を作る」と説明されています。

技術基盤は、Google DeepMindが2026年5月19日に発表したマルチモーダルモデルファミリーGemini Omniです。画像・音声・動画・テキストを組み合わせて動画を生成するOmni Flashが、顔の再現と音声合成を担います。カートゥン風のキャラクターではなく、登録した本人に近い「磨かれたデジタルクローン」として出力される点が特徴です。Android Authorityの著者Adamya Sharma氏は、顔の動きと声のトーンが非常にリアルで、知人ならAI生成と気づかない可能性があると体験談を書いています(参考)。

なぜ今、有料ユーザーへの展開が広がったのか

Avatarの存在は2026年3月のAPK解析で先に判明していました。正式発表はGoogle I/O 2026(2026年5月19日)で、Gemini Omniとセットで紹介されました。Josh Woodward氏(VP, Google Labs)によると、Geminiアプリの月間利用者は9億人以上に達しており、Omniは「シネマティックな高品質動画出力」とカスタムAIアバターを柱に据えています。

6月初旬の展開拡大は、この発表から約2週間後のロールアウト段階です。Google AI Plus / Pro / Ultraの購読者を対象に、機能が順次有効化されています。全員が同日に使えるわけではなく、Googleの展開方式どおり段階的に届く形です。

セットアップと使い方

Avatarの作成はGeminiアプリのSettings(設定)から行います。公式ヘルプでは「Personal avatar」、Android Authorityでは「Avatar」と表記されており、UI表記に差がある可能性があります。

登録手順は次のとおりです。

  1. ガイド付きの登録(enrollment)に従い、顔と声を録画する
  2. カメラを見ながら頭を左右にゆっくり動かす
  3. 画面に表示された数字を声に出して読む(顔の構造と声をマッピングするため)
  4. 完了後、チャット内で@meまたは@(Googleユーザー名)でアバターを呼び出す

利用例として、公式ヘルプには「@[Googleユーザー名]がオーケストラと一緒に歌う動画を作って」「@[Googleユーザー名]がドラゴンと対峙する主人公の物語を書いて」といったプロンプトが掲載されています。プロンプト入力欄のAvatarボタンを押すか、@からユーザー名を選んでも呼び出せます。

The Next Webの報道によると、Omni Flashのクリップ長はローンチ時点で10秒上限です。モデル自体の制約ではなくデプロイ判断によるもので、Soraの最大60秒より短いとされています(参考)。短尺のSNS向け動画や試作には向きますが、長編を一度に作る用途には現時点では向きません。

利用条件と制限

Avatarは誰でも使える機能ではありません。主な条件を整理します。

項目 内容
年齢 18歳以上
プラン Google AI Plus / Pro / Ultra(個人Googleアカウント)
言語 英語のみ(現時点)
地域 EEA・スイス・英国では利用不可
本人確認 セットアップ時はアカウント所有者本人がカメラの前にいる必要あり

録画環境にも条件があります。静かな場所、適度な明るさ、目・鼻・口が見えること(メガネ可、サングラス・マスク・帽子不可)、背景に他者の顔が写らないことが求められます。

Google AIプランは2026年5月に再編され、米国ではPlusが月額$7.99、Proが$19.99、Ultra(5x)が$99.99、Ultra(20x)が$199.99です。Omni FlashはPlus以上の全プランで利用可能ですが、Avatar作成と動画生成にはいずれも有料プランが必須です。

Google Vidsのアバターと混同しない

Googleには別途、Google Vids向けのAIアバター機能もあります。VidsではVeo 3.1を使った2D/3Dカートゥンアバターや、カスタム外見・衣装の設定が可能です。対象はWorkspaceおよびGoogle AI Pro・Ultra向けで、2026年2〜3月頃から段階展開されています。

GeminiアプリのAvatarは個人の顔クローンをGeminiアプリ内で作り、チャットから動画生成に使う機能です。Vidsは業務向けの動画制作ツール上で、カートゥンや汎用アバターを使う別製品です。用途も入口も異なるため、名前に「アバター」と付く点だけで同一機能と見なす必要はありません。

ディープフェイク対策とプライバシー

顔と声を複製する機能には悪用リスクが伴います。Googleは複数のガードレールを設けています。

Omniで生成したすべての動画には、目に見えないSynthIDデジタル透かしが埋め込まれます。検証はGeminiアプリ、Gemini in Chrome、Google Searchから行えます。Android AuthorityはChromeの右クリックやSearchツールでも確認できると記載しています。The Next WebはSynthIDがC2PAオープン標準の文脈で、業界横断のAI生成ビジュアルの来歴(provenance)インフラとして位置づけられていると分析しています(参考)。

一般向けの音声・発話編集(speech editing)は、ディープフェイクや無断音声編集への配慮から意図的に保留されています。Google公式ブログでは「責任ある提供のためまだテスト中」と説明されており、当面はボイス参照のみが使えます。

アバターを削除すると、新規のAI生成コンテンツはそのアバターでは作れなくなります。ただし既に公開した動画は削除されません。録画したセルフィーと音声データはGoogleシステムから削除され、再作成には再録画が必要です。

今後の展望

Omni FlashはGeminiアプリとGoogle Flow経由でPlus以上に展開中です。YouTube ShortsとYouTube Create Appでは無料でも利用が始まっていますが、Avatar機能自体は有料プランと英語環境に限定されています。

開発者・エンタープライズ向けAPIは「今後数週間」で展開予定とGoogleは述べており、将来的には画像・音声などの出力モダリティも追加される見込みです。言語や地域の制限が緩和されれば、日本語ユーザーにも届く可能性があります。現時点では英語圏の有料購読者が、自分そっくりの動画生成を試せる最初の層と言えます。