Googleの次世代AIモデルが、公式発表を待たずにその姿を現しました。2026年5月2日、AIモデルの匿名対戦プラットフォーム「LM Arena」上で未発表のGemini Flashモデルが確認されています。同じタイミングでVertex AIユーザーにはGemini 3.1 Flash LiteのGA(一般提供)化を知らせるメールが届きました。Gemini 2.5シリーズは2026年10月以降に廃止が予定されており、Geminiの世代交代が急ピッチで進んでいます。
この記事でわかること
- LM Arenaで確認された新Gemini Flashモデルの意味
- Gemini 3.1 Flash LiteのGA化とVertex AI移行通知の内容
- Gemini 2.5廃止のタイムラインと対象モデル
- 移行時に注意すべきThought SignaturesとSDKの変更
- 現行Gemini 3系の料金比較
LM Arenaに未発表のGemini Flashモデルが出現
https://x.com/testingcatalog/status/2050449347137937437
テクノロジーメディアのTestingCatalogが5月2日に報じたところによると、LM Arena上で新しいGemini Flashモデルが確認されました。Googleからの公式発表はなく、ステルステストの段階とみられます。
LM ArenaはAIモデルを匿名で比較評価するプラットフォームです。各社が正式リリース前のモデルをテストする場として知られており、過去にもGemini 3 ProやGemini 3 Flashが正式発表前にここで目撃されてきました。新モデル登場を先取りするシグナルとして、開発者コミュニティでは注目度の高い情報源です。
現時点でこのモデルのバージョン名や性能は公開されていません。ただし、Gemini 3 Flash(2025年12月リリース)の後にGemini 3.1 Flash Lite(2026年3月)が公開されている流れを踏まえると、Flashシリーズの次期モデルが開発中であることは自然な展開です。
Gemini 3.1 Flash LiteがまもなくGAへ
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-lite/
同日、Vertex AIでGemini Flash 2系を利用しているユーザーに対して、Googleから移行を促すメールが送られました。メールには「Transition to Gemini 3.1 Flash Lite – Generally Available soon!」と記載されています。
Gemini 3.1 Flash Liteは2026年3月3日にプレビュー版として公開されたモデルです。Gemini 3シリーズで最もコスト効率の高いモデルとして設計され、大量処理や低遅延が求められるワークロードに最適化されています。
主な性能と料金は以下の通りです。
- GPQA Diamond: 86.9%
- 初回トークン出力速度: Gemini 2.5 Flashの2.5倍
- 出力生成速度: Gemini 2.5 Flashより45%高速
- 入力料金: 100万トークンあたり0.25ドル
- 出力料金: 100万トークンあたり1.50ドル
GAになれば本番環境でのSLA付きサポートが提供され、Gemini 2.5 Flash Liteからの正式な移行先になります。
Gemini 2.5シリーズは2026年10月16日以降に廃止
Googleは2026年4月、Vertex AI上のGemini 2.5モデルの廃止スケジュールをメールで通知しました(参考)。対象はGemini 2.5 Pro、Gemini 2.5 Flash、Gemini 2.5 Flash Liteの3モデルです。
廃止予定日は2026年10月16日以降とされています。当初は6月の予定でしたが、移行期間を確保するために延長されました。最終的な廃止日はGemini 3のGA後に確定し、少なくとも6か月前に告知されます。
なお、この廃止はVertex AIのみが対象です。Google AI Studio経由で利用している場合は別のスケジュールが適用されるため、Gemini APIのchangelogを確認してください。
移行先となるGemini 3系の現行ラインナップ
Gemini 2.5からの移行先を、モデルごとに整理します。
Gemini 3.1 Proは2026年2月にリリースされた、Gemini 3系で最も高い推論能力を持つモデルです。ARC-AGI-2で77.1%、GPQA Diamondで約94.3%を記録しています。入力料金は100万トークンあたり2.00ドル(20万トークン以下の場合)で、Gemini 2.5 Proからの移行先に該当します。
Gemini 3 Flashは2025年12月リリースで、速度とコストのバランスに優れています。GPQA Diamondで90.4%を達成し、前世代のGemini 2.5 Proを上回りました。SWE-bench Verifiedでは78%を記録し、コーディングタスクではGemini 3 Proをも凌駕します。Gemini 2.5 Proの3倍高速で、入力料金は100万トークンあたり0.50ドルです。Gemini 2.5 Flashからの移行先になります。
Gemini 3.1 Flash Liteは前述の通り、最もコスト効率が高いモデルです。Gemini 2.5 Flash Liteからの移行先として設計されています。
Googleは、移行時にモデルティアの変更も検討するよう推奨しています。たとえばGemini 2.5 ProからGemini 3 Flashへ、Gemini 2.5 FlashからGemini 3.1 Flash Liteへと一段下のティアに変更することで、性能を維持しつつ料金を抑えられる場合があります。
移行時に押さえるべき技術的な変更点
Thought Signatures
Gemini 3では「Thought Signatures(思考署名)」が導入されました。モデルの推論状態を暗号化して保持する仕組みで、マルチターン会話やFunction Calling時に推論の連続性を担保します。
Gemini 2.5よりも厳密なバリデーションが適用されるため、レスポンスに含まれるThought Signaturesを次のリクエストにそのまま含める必要があります。欠落した場合は400エラーが返り、リクエストが失敗します。
Google公式のGen AI SDK(Python、Node.js、Go、Java)でチャット履歴機能を使っている場合は自動で処理されます。APIを直接呼び出している場合は、手動で受け渡し処理の実装が必要です。
SDKの切り替え
2026年6月以降にリリースされるVertex AI SDKでは、Geminiがサポート対象外になります。新しいGemini機能はGen AI SDKでのみ提供されるため、既存のVertex AI SDKからの移行を早めに進めるべきです。
料金構造の変化
Gemini 3系はトークン単価が上がっていますが、トークン効率も向上しています。Gemini 3 FlashはGemini 2.5 Proと比較して、平均30%少ないトークンでタスクを完了します。総コストが上がるか下がるかは用途次第のため、移行前に代表的なワークロードで実測するのが確実です。
今やるべきこと
LM Arena上の新モデル出現、Gemini 3.1 Flash LiteのGA化予告、Gemini 2.5の廃止通知と、Geminiの世代交代は複数の方向から同時に進んでいます。Vertex AIでGemini 2.5を使っている開発者は、10月の廃止期限を待たずGemini 3系でのテストを始めておくのが得策です。特にThought Signaturesの対応とGen AI SDKへの切り替えはコード修正を伴うため、余裕を持った計画が重要になります。