Mac上のファイルを自動整理し、Googleシートに変換する——そんなAIエージェント機能が、Gemini for macOSに近日追加されそうです。
9to5GoogleのAPKティアダウンにより、Googleがmacで動作するコンピューター操作型エージェントを開発中であることが明らかになりました。
この記事でわかること:
- APKティアダウンで判明した4つのエージェント機能の詳細
- GeminiがmacOSのScreen AccessとAccessibilityをどう使うか
- 現時点のGemini for macOSでできること
- Claude CoworkやOpenAIとの比較
https://9to5google.com/2026/05/05/gemini-agent-macos-organize-files/
Gemini for macOSの現状
Googleは2026年4月15日、macOS向けのネイティブGeminiアプリをリリースしました。現在のアプリは主に2つの機能で構成されています。
1つ目はWebアプリと同様のチャットインターフェースです。2つ目はOption+Spaceショートカットで画面上の任意の場所からGeminiを呼び出せるクイックアクセス機能です。後者はウィンドウ共有機能と組み合わせることで、Geminiが現在の作業画面を「見た」状態で質問に答えられます。
ただし現時点では、Geminiがユーザーの代わりにファイルを操作したりアプリを制御したりする能力はなく、チャットアシスタントとしての立ち位置にとどまっています。
APKから判明した4つのエージェント機能
9to5GoogleのAPK Insightチームがアプリのコードを解析したところ、次のエージェント機能に関する文字列が見つかりました。
ファイルをシートに変換
デスクトップ上の請求書やレポートなど、ローカルフォルダをスキャンしてデータを抽出し、Googleシートに構造化します。
フォルダ整理
デスクトップやダウンロードフォルダ内の散乱したファイルを見つけ、種類や用途でまとめてアーカイブします。
ファイル名の統一
ファイルのメタデータを読み取り、数百のファイルをクリーンで読みやすいサブフォルダ名にバッチリネームします。
会議のフォローアップ
Google Meetのトランスクリプトや最新のメモドキュメントを取得し、ハイライトとアクションアイテムを含むフォローアップメールの下書きを作成します。
最初の3つはMacのローカルファイル操作に特化しており、4つ目はGoogle MeetやDocs、Gmailといったワークスペースアプリと連携する機能です。
macOSの権限を使ってPCを直接操作する
これらのエージェント機能が動作するには、macOSのScreen AccessとAccessibilityの権限が必要になります。この2つを取得することで、GeminiはMacの画面を「見る」だけでなく、マウスとキーボードを操作してアプリと直接やり取りできるようになります。
Googleはすでに2025年10月にGemini 2.5 Computer Useモデルを開発者向けプレビューとして公開しています。今回のmacOSエージェントは、その延長線上にある実装です。
Claude CoworkやOpenAIと何が違うか
このエージェント機能はAnthropicのClaude Coworkと直接競合する位置付けです。Claude CoworkはすでにmacOS上でのPC操作を実現しており、ファイル操作・アプリ制御・スケジュール実行に対応しています。
OpenAIはChatGPT・Atlas・Codexを統合したスーパーアプリを開発中とされていますが、詳細な発表はまだありません(TechRadar報道より)。
Google Workspaceをすでに業務で使っている組織にとって、Geminiエージェントは実用的な選択肢になりえます。MeetやDocs・Sheetsとの連携が前提で設計されているため、既存のワークフローにそのまま組み込める可能性があります。
一方、Googleはこれらの機能についてまだ公式発表を行っておらず、リリース時期も不明です。APKティアダウンはあくまで開発中のコードから推測したものであり、機能の仕様や提供範囲が変わる可能性もあります。