有料版Geminiを使っているのに、途中から最初の指示を忘れ始める——そんな不満が2026年6月、SNSやRedditで相次いで報告されています。GoogleはAI Pro・AI Ultraで最大100万トークンのコンテキストウィンドウをうたっていますが、実際のチャットではもっと早い段階で「物忘れ」が起きるという指摘です。
この記事では、公式のスペック表示と利用者が感じるギャップ、検証で示された数字、実務での対処法を整理します。
この記事でわかること
- Google公式が各プランで開示しているコンテキストウィンドウの上限
- 有料ユーザーが報告する「会話途中の記憶喪失」の実態
- Android Authorityが報じた、チャットアプリとAI Studioの差
- 長文やコーディングをGeminiで進めるときの注意点
公式は100万トークン、チャットは早めに記憶が切れる
コンテキストウィンドウとは、AIが一度に参照できるテキスト量の上限です。トークンは単語や文字の断片を数える単位で、100万トークンはおおよそ1500ページの文書や3万行のコードに相当すると、Googleは説明しています。
Gemini Appsのヘルプでは、無料プランは3万2000トークン、AI Plusは12万8000トークン、AI Pro・AI Ultraは100万トークンと一覧化されています。プロモーションでも同じ数字が前面に出ており、有料契約の大きな売りの一つです。
一方、Android Authorityの2026年6月4日の報道では、複数の有料ユーザーがチャット画面の実運用と宣伝にずれがあると訴えていると紹介されています。静的なファイルを最初のプロンプトで読み込む処理は成功しても、会話が続くにつれて以前の指示やコードブロックを忘れる——こうした「チャット内の物忘れ」が問題の核心です。
検証では動的メモリが約1万6000トークンと指摘
Xのユーザー @Soso_fun_yt は、この問題を具体的な数字つきで文書化したと、Android Authorityは伝えています。同記事によると、巨大な静的ファイルの初回読み込みは通る一方で、会話を維持するための動的なコンテキスト(KVキャッシュとも呼ばれる領域)は、実質おおよそ1万6000トークン前後まで縮むと指摘されています。
メッセージ数に換算すると、平均25〜30往復ほどで記憶が頭打ちになり、会話の冒頭で決めた制約やコードの構造を無視し始める、という報告です。有料プランの100万トークンが「1本の会話を最後まで覚え続ける力」としてそのまま働いていない、という見方につながります。
Googleは現時点でこの数字の妥当性について公式に説明していません。Android AuthorityはGoogleに、モデル全体のコンテキストウィンドウとチャット用バッファの違い、UI上の注意表示の有無について問い合わせたと書いており、執筆時点では回答は掲載されていません。
チャットアプリとAI Studioで体験が分かれる
注目すべきは、プラットフォーム間の差です。Redditの利用者のうち、Google AI Studioでは宣言どおりのコンテキストが使えると報告する声がある一方、一般向けのGeminiチャットアプリでは同じ長さの会話を維持できない、という指摘がAndroid Authorityにも取り上げられています。
AI Studioは開発者向けの試作環境で、API経由でGeminiの性能を確認する用途に向いています。同じGoogleの基盤でも、消費者向けチャットのフロントエンドには別の制限がかかっている可能性を示唆します。Android Authorityは、この差を「ダウンロード速度は1Gbpsと大きく表示しつつ、アップロード上限は小さく記載する回線事業者」に例え、表示の透明性に疑問を投げかけています。
長文・コーディング利用者が取るべき対策
100万トークンは「1回で巨大な資料を渡して要約や分析を始める」場面では力を発揮しやすい一方、同じスレッドで何十回も往復するワークフローとは相性が悪い可能性があります。コーディングでは、会話の前半で共有した設計ルールや関数定義が後半で消えると、出力の品質が一気に崩れます。
現実的な対策は次のとおりです。
- 長い作業は会話を25〜30往復ごとに分割し、要約や仕様を新しいスレッドへ引き継ぐ
- 重要な制約は毎回のプロンプトに短く再掲する
- 大規模なリポジトリや仕様書はAI StudioやAPI経由で扱い、チャットアプリは補助に回す
Googleのヘルプは、コンテキストを超えると「提供した内容の一部を反映しない応答」につながりうると注意しています。ただし、これは上限値の話であり、チャット中の動的バッファの制限までは明記していません。
生成AIのスペック表示は「入力」と「会話」で分けて読む
Geminiだけの話に閉じません。どのLLM(大規模言語モデル)も、スペックシートの最大トークン数と実際のチャット体験は一致しないことがあります。「ファイルを一度読み込む能力」と「長い対話の記憶力」は別指標として押さえる必要があります。
有料契約前に、公式ページの数字が静的入力向けなのか会話継続向きなのかを確認することは、これからのAI選定で欠かせないステップです。Googleがチャット用の実効メモリを明示するか改善するかは今後の動向に委ねられますが、現状では宣伝どおりの長期記憶を前提にしたプロジェクト設計は危険です。