Googleの次世代AIモデルが、公式発表を待たずにその姿を現しました。2026年5月2日、AIモデルの匿名対戦プラットフォーム「LM Arena」上で未発表のGemini Flashモデルが確認されています。同じタイミングでVertex AIユーザーにはGemini 3.1 Flash LiteのGA(一般提供)化を知らせるメールが届きました。Gemini 2.5シリーズは2026年10月以降に廃止が予定されており、Geminiの世代交代が急ピッチで進んでいます。

この記事でわかること

  • LM Arenaで確認された新Gemini Flashモデルの意味
  • Gemini 3.1 Flash LiteのGA化とVertex AI移行通知の内容
  • Gemini 2.5廃止のタイムラインと対象モデル
  • 移行時に注意すべきThought SignaturesとSDKの変更
  • 現行Gemini 3系の料金比較

LM Arenaに未発表のGemini Flashモデルが出現

https://x.com/testingcatalog/status/2050449347137937437

テクノロジーメディアのTestingCatalogが5月2日に報じたところによると、LM Arena上で新しいGemini Flashモデルが確認されました。Googleからの公式発表はなく、ステルステストの段階とみられます。

LM ArenaはAIモデルを匿名で比較評価するプラットフォームです。各社が正式リリース前のモデルをテストする場として知られており、過去にもGemini 3 ProやGemini 3 Flashが正式発表前にここで目撃されてきました。新モデル登場を先取りするシグナルとして、開発者コミュニティでは注目度の高い情報源です。

現時点でこのモデルのバージョン名や性能は公開されていません。ただし、Gemini 3 Flash(2025年12月リリース)の後にGemini 3.1 Flash Lite(2026年3月)が公開されている流れを踏まえると、Flashシリーズの次期モデルが開発中であることは自然な展開です。

Gemini 3.1 Flash LiteがまもなくGAへ

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-lite/

同日、Vertex AIでGemini Flash 2系を利用しているユーザーに対して、Googleから移行を促すメールが送られました。メールには「Transition to Gemini 3.1 Flash Lite – Generally Available soon!」と記載されています。

Gemini 3.1 Flash Liteは2026年3月3日にプレビュー版として公開されたモデルです。Gemini 3シリーズで最もコスト効率の高いモデルとして設計され、大量処理や低遅延が求められるワークロードに最適化されています。

主な性能と料金は以下の通りです。

  • GPQA Diamond: 86.9%
  • 初回トークン出力速度: Gemini 2.5 Flashの2.5倍
  • 出力生成速度: Gemini 2.5 Flashより45%高速
  • 入力料金: 100万トークンあたり0.25ドル
  • 出力料金: 100万トークンあたり1.50ドル

GAになれば本番環境でのSLA付きサポートが提供され、Gemini 2.5 Flash Liteからの正式な移行先になります。

Gemini 2.5シリーズは2026年10月16日以降に廃止

https://gcpstudyhub.com/blog/google-is-retiring-gemini-2-5-on-vertex-ai-what-you-need-to-know-and-do-before-october-2026

Googleは2026年4月、Vertex AI上のGemini 2.5モデルの廃止スケジュールをメールで通知しました(参考)。対象はGemini 2.5 Pro、Gemini 2.5 Flash、Gemini 2.5 Flash Liteの3モデルです。

廃止予定日は2026年10月16日以降とされています。当初は6月の予定でしたが、移行期間を確保するために延長されました。最終的な廃止日はGemini 3のGA後に確定し、少なくとも6か月前に告知されます。

なお、この廃止はVertex AIのみが対象です。Google AI Studio経由で利用している場合は別のスケジュールが適用されるため、Gemini APIのchangelogを確認してください。

移行先となるGemini 3系の現行ラインナップ

Gemini 2.5からの移行先を、モデルごとに整理します。

Gemini 3.1 Proは2026年2月にリリースされた、Gemini 3系で最も高い推論能力を持つモデルです。ARC-AGI-2で77.1%、GPQA Diamondで約94.3%を記録しています。入力料金は100万トークンあたり2.00ドル(20万トークン以下の場合)で、Gemini 2.5 Proからの移行先に該当します。

Gemini 3 Flashは2025年12月リリースで、速度とコストのバランスに優れています。GPQA Diamondで90.4%を達成し、前世代のGemini 2.5 Proを上回りました。SWE-bench Verifiedでは78%を記録し、コーディングタスクではGemini 3 Proをも凌駕します。Gemini 2.5 Proの3倍高速で、入力料金は100万トークンあたり0.50ドルです。Gemini 2.5 Flashからの移行先になります。

Gemini 3.1 Flash Liteは前述の通り、最もコスト効率が高いモデルです。Gemini 2.5 Flash Liteからの移行先として設計されています。

Googleは、移行時にモデルティアの変更も検討するよう推奨しています。たとえばGemini 2.5 ProからGemini 3 Flashへ、Gemini 2.5 FlashからGemini 3.1 Flash Liteへと一段下のティアに変更することで、性能を維持しつつ料金を抑えられる場合があります。

移行時に押さえるべき技術的な変更点

Thought Signatures

Gemini 3では「Thought Signatures(思考署名)」が導入されました。モデルの推論状態を暗号化して保持する仕組みで、マルチターン会話やFunction Calling時に推論の連続性を担保します。

Gemini 2.5よりも厳密なバリデーションが適用されるため、レスポンスに含まれるThought Signaturesを次のリクエストにそのまま含める必要があります。欠落した場合は400エラーが返り、リクエストが失敗します。

Google公式のGen AI SDK(Python、Node.js、Go、Java)でチャット履歴機能を使っている場合は自動で処理されます。APIを直接呼び出している場合は、手動で受け渡し処理の実装が必要です。

SDKの切り替え

2026年6月以降にリリースされるVertex AI SDKでは、Geminiがサポート対象外になります。新しいGemini機能はGen AI SDKでのみ提供されるため、既存のVertex AI SDKからの移行を早めに進めるべきです。

料金構造の変化

Gemini 3系はトークン単価が上がっていますが、トークン効率も向上しています。Gemini 3 FlashはGemini 2.5 Proと比較して、平均30%少ないトークンでタスクを完了します。総コストが上がるか下がるかは用途次第のため、移行前に代表的なワークロードで実測するのが確実です。

今やるべきこと

LM Arena上の新モデル出現、Gemini 3.1 Flash LiteのGA化予告、Gemini 2.5の廃止通知と、Geminiの世代交代は複数の方向から同時に進んでいます。Vertex AIでGemini 2.5を使っている開発者は、10月の廃止期限を待たずGemini 3系でのテストを始めておくのが得策です。特にThought Signaturesの対応とGen AI SDKへの切り替えはコード修正を伴うため、余裕を持った計画が重要になります。