ChatGPTのAndroidアプリで、画面共有の仕組みが大きく変わるかもしれません。OpenAIが開発中の新方式では、従来の画面録画を使わず、Androidの「Accessibility API」と「Bubbles」を組み合わせて画面の内容を読み取ります。

この記事でわかること

  • 現在の画面共有が抱える問題
  • 新しい方式の仕組みと設定手順
  • プライバシー面で残る懸念

現在の画面共有はなぜ重いのか

https://www.androidauthority.com/chatgpt-android-17-new-screen-sharing-3662693/

ChatGPTのAndroidアプリは、画面共有にMediaProjection APIを使っています。これはAndroidの画面録画やキャストと同じ仕組みで、画面全体を映像として常時キャプチャします。

そのため、いくつかの課題があります。まず、画面を録画し続けるためCPUとメモリの消費が大きく、他のアプリの動作が遅くなることがあります。また、画面共有を開始するたびに権限確認のダイアログが表示され、作業の流れが中断されます。バッテリーの消耗も無視できません。

Accessibility APIとBubblesを使った新方式

OpenAIはChatGPTアプリのバージョン1.2026.118で、まったく異なるアプローチを開発していることがAndroid Authorityの解析で判明しました。映像キャプチャの代わりに、AndroidのAccessibility APIを使って画面上のテキストやボタン、UI要素を直接読み取る方式です。

Accessibility APIは本来、視覚に障害のあるユーザー向けにアプリの画面情報を読み上げるための仕組みです。この機能を活用することで、映像を録画せずに画面の内容をAIに伝えられます。

さらに、AndroidのBubbles機能を組み合わせています。Bubblesはアプリを小さなフローティングウィンドウとして画面上に常駐させる機能で、Android 17で正式に搭載されました。ただし、Bubbles API自体はAndroid 11から存在しているため、Android 17より前のバージョンでも利用できる可能性があります。

設定の流れと使い方

初回利用時の設定は以下のとおりです。まずAndroidの設定画面から「ChatGPT screen help」をAccessibility設定で有効にします。次に、ChatGPTアプリの通知と会話バブルを許可します。

設定が完了すると、画面上にChatGPTのバブルが常駐します。ホーム画面でも他のアプリの中でも表示され、タップするとその時点で画面に映っている内容についてChatGPTに質問できます。

注目すべき点として、この機能は既存のチャット履歴を参照しません。バブルから起動した場合、ChatGPTは今画面に表示されている情報だけに集中して回答します。

従来方式との違い

新旧の方式を比較すると、違いは明確です。

従来のMediaProjection方式は画面全体を映像として記録するため、リソース消費が大きくなります。権限ダイアログも毎回表示されます。

新しいAccessibility方式は、映像を使わずにUI要素のテキスト情報を読み取るだけです。映像エンコードが不要なため、CPUやメモリへの負荷は大幅に軽くなります。バブルによる常駐で、アプリを切り替える手間も省けます。

プライバシー面の懸念

Accessibility APIは強力な権限です。画面上のすべてのテキストとUI要素を読み取れるため、慎重に扱う必要があります。

現時点で明らかになっていない点が2つあります。1つは、読み取ったデータがデバイス上で処理されるのか、OpenAIのサーバーに送信されるのかという点です。もう1つは、銀行アプリやパスワード入力画面、二要素認証の画面など、機密性の高い画面が読み取り対象から除外されるかどうかです。

OpenAIもGoogleも、これらの疑問にはまだ公式に回答していません。

まだ正式リリースではない

この機能はAPK解析(アプリのコードを調べて開発中の機能を見つける手法)で発見されたものです。開発中のコードが製品版に実装されるとは限りません。正式リリースの時期も未定です。

ただ、画面共有の軽量化はモバイルAIアシスタントにとって重要な課題です。映像キャプチャからテキスト読み取りへの転換は、バッテリーやパフォーマンスの問題を根本から解決する方向性として注目に値します。プライバシーの扱いについてOpenAIが今後どのような対策を示すか、続報を待ちたいところです。