ChatGPTのAndroidアプリで、画面共有の仕組みが大きく変わるかもしれません。OpenAIが開発中の新方式では、従来の画面録画を使わず、Androidの「Accessibility API」と「Bubbles」を組み合わせて画面の内容を読み取ります。
この記事でわかること
- 現在の画面共有が抱える問題
- 新しい方式の仕組みと設定手順
- プライバシー面で残る懸念
現在の画面共有はなぜ重いのか
https://www.androidauthority.com/chatgpt-android-17-new-screen-sharing-3662693/
ChatGPTのAndroidアプリは、画面共有にMediaProjection APIを使っています。これはAndroidの画面録画やキャストと同じ仕組みで、画面全体を映像として常時キャプチャします。
そのため、いくつかの課題があります。まず、画面を録画し続けるためCPUとメモリの消費が大きく、他のアプリの動作が遅くなることがあります。また、画面共有を開始するたびに権限確認のダイアログが表示され、作業の流れが中断されます。バッテリーの消耗も無視できません。
Accessibility APIとBubblesを使った新方式
OpenAIはChatGPTアプリのバージョン1.2026.118で、まったく異なるアプローチを開発していることがAndroid Authorityの解析で判明しました。映像キャプチャの代わりに、AndroidのAccessibility APIを使って画面上のテキストやボタン、UI要素を直接読み取る方式です。
Accessibility APIは本来、視覚に障害のあるユーザー向けにアプリの画面情報を読み上げるための仕組みです。この機能を活用することで、映像を録画せずに画面の内容をAIに伝えられます。
さらに、AndroidのBubbles機能を組み合わせています。Bubblesはアプリを小さなフローティングウィンドウとして画面上に常駐させる機能で、Android 17で正式に搭載されました。ただし、Bubbles API自体はAndroid 11から存在しているため、Android 17より前のバージョンでも利用できる可能性があります。
設定の流れと使い方
初回利用時の設定は以下のとおりです。まずAndroidの設定画面から「ChatGPT screen help」をAccessibility設定で有効にします。次に、ChatGPTアプリの通知と会話バブルを許可します。
設定が完了すると、画面上にChatGPTのバブルが常駐します。ホーム画面でも他のアプリの中でも表示され、タップするとその時点で画面に映っている内容についてChatGPTに質問できます。
注目すべき点として、この機能は既存のチャット履歴を参照しません。バブルから起動した場合、ChatGPTは今画面に表示されている情報だけに集中して回答します。
従来方式との違い
新旧の方式を比較すると、違いは明確です。
従来のMediaProjection方式は画面全体を映像として記録するため、リソース消費が大きくなります。権限ダイアログも毎回表示されます。
新しいAccessibility方式は、映像を使わずにUI要素のテキスト情報を読み取るだけです。映像エンコードが不要なため、CPUやメモリへの負荷は大幅に軽くなります。バブルによる常駐で、アプリを切り替える手間も省けます。
プライバシー面の懸念
Accessibility APIは強力な権限です。画面上のすべてのテキストとUI要素を読み取れるため、慎重に扱う必要があります。
現時点で明らかになっていない点が2つあります。1つは、読み取ったデータがデバイス上で処理されるのか、OpenAIのサーバーに送信されるのかという点です。もう1つは、銀行アプリやパスワード入力画面、二要素認証の画面など、機密性の高い画面が読み取り対象から除外されるかどうかです。
OpenAIもGoogleも、これらの疑問にはまだ公式に回答していません。
まだ正式リリースではない
この機能はAPK解析(アプリのコードを調べて開発中の機能を見つける手法)で発見されたものです。開発中のコードが製品版に実装されるとは限りません。正式リリースの時期も未定です。
ただ、画面共有の軽量化はモバイルAIアシスタントにとって重要な課題です。映像キャプチャからテキスト読み取りへの転換は、バッテリーやパフォーマンスの問題を根本から解決する方向性として注目に値します。プライバシーの扱いについてOpenAIが今後どのような対策を示すか、続報を待ちたいところです。