AIエージェントがクラウドPCを操作 AWS WorkSpaces Agent Accessとは
AWSが、AIエージェントに仮想デスクトップを割り当てて業務アプリを自動操作させる新機能「WorkSpaces Agent Access」を2026年5月5日にプレビュー公開しました。
この記事でわかること:
- AWS WorkSpaces Agent Accessが解決する「最後の1マイル問題」
- MCPとIAMを使った仕組みと設定の流れ
- コストと注意点(クリック1回に最大50万トークンという試算)
- Microsoft Windows 365 Cloud PCとの比較
デスクトップアプリがAIの壁になっている
企業のAI活用が進む中、特定の障害が残っています。APIを持たないレガシーアプリケーションです。
Gartnerの調査によると、75%の組織がAPIを持たないレガシーアプリを運用しており、Fortune 500企業の71%が現代的なプログラムアクセス手段を持たないメインフレームで基幹業務を動かしています(参考)。
ERPシステム、保険の査定ツール、医療の処方システムなど、業務の核心をGUIアプリが担っている現場では、AIエージェントを導入するために高コストなシステム刷新を迫られるか、AI導入を後回しにするかの二択になっていました。
WorkSpaces Agent Accessはこの「最後の1マイル問題」に対するAWSの答えです。アプリ側を一切変更せず、既存のデスクトップ環境にエージェントを接続します。
仕組み:MCPとIAMで制御する
WorkSpaces Agent Accessの核心は、エージェントに人間と同じクラウドPCを使わせるというシンプルな発想です。
エージェントはスクリーンショットでデスクトップの状態を「見て」、マウスのクリック・テキスト入力・スクロールで操作します。これは人間がPCを使う方法と変わりません。
AWSがこの仕組みに使っているのはMCP(Model Context Protocol)です。WorkSpacesは管理されたMCPエンドポイントを公開し、LangChain・CrewAI・Strands Agentsなど主要なエージェントフレームワークはすべてこのエンドポイントに接続できます。
認証にはIAM(AWS Identity and Access Management)を使います。各エージェントに固有のIAMアイデンティティを付与することで、エージェントの操作ログを人間の操作と分離して追跡できます。操作履歴はCloudTrailとCloudWatchに記録されます。
AWSはエージェントごとに固有のIDを与えることを推奨しています。誰が何をしたか監査する際に、人間のアクションとエージェントのアクションを区別しやすくなるためです。
設定の流れ
WorkSpaces Agentの設定はAWSマネジメントコンソールから行います。
WorkSpacesコンソールで新しいスタック(接続環境の定義)を作成する際、ステップ3の「AIエージェント」セクションで「Add AI Agents」を選択します。このオプションはデフォルトでは無効で、通常の人間用WorkSpacesと区別されています。
エージェント機能として有効化できるのは以下の3つです。
- Computer input: クリック・入力・スクロールの許可
- Computer vision: スクリーンショットによるデスクトップ認識
- Screenshot storage: 監査・デバッグ用の画面記録の保存先
画面解像度はデフォルト1280×720で、UIの密度に応じて変更できます。
スタック設定後、WorkSpacesはMCPエンドポイントを公開します。エージェントフレームワークからこのエンドポイントとIAM認証情報を指定すれば、エージェントが接続してデスクトップアプリを操作し始めます。
AWSの公式デモでは、Strands Agent SDKを使ったエージェントがAPIを持たない処方薬システムにアクセスし、患者記録の検索・薬の発注・完了確認までを自動実行しています。
コストには注意が必要
エージェントによるデスクトップ操作には注意すべきコスト構造があります。
AIコーディングスタートアップのReflexが行ったベンチマークでは、ブラウザ操作エージェントがドロップダウンメニューを1回クリックするために約50万トークンを消費したと報告されています。計算上、APIを直接呼ぶ方法と比べて45倍高コストになるという結論です(参考)。
ただし、モデルの能力向上とともにコストは下がる見通しです。また「APIが存在しないアプリを操作する手段がデスクトップ経由しかない」状況では、コスト比較の前提が変わります。
WorkSpacesの料金はインスタンスタイプによって異なります。月額定額プランと時間課金プランの2種類があり、エージェント用途では実行時間だけ立ち上げて終了させる時間課金が合いやすいでしょう。インスタンスは1 vCPU / 2GB RAMの小型から、GPU搭載の32 vCPU / 256GB RAMの大型まで選べます。
Microsoftも同じ動きをしている
AWSは「エージェント専用クラウドPC」を提供する唯一のクラウドベンダーではありません。Microsoftも「Windows 365 Cloud PC for agents」という同様のサービスを展開しています。
エージェントに仮想PCを割り当てるというアーキテクチャが業界標準になりつつあることを示しています。
プレビューの提供状況
現時点でプレビュー中で、追加コストなしで利用できます。対応リージョンは以下の通りです。
- 米国: 東部(バージニア北部、オハイオ)、西部(オレゴン)
- カナダ: カナダ中部
- ヨーロッパ: フランクフルト、アイルランド、パリ、ロンドン
- アジア: 東京、ムンバイ、シドニー、ソウル、シンガポール
東京リージョンが対象に含まれているため、日本企業もすぐに試せます。
試すにはAWSのGitHubサンプルリポジトリが出発点になります。
まとめ
AWS WorkSpaces Agent Accessは、モダナイゼーションなしにAIエージェントを既存の業務デスクトップアプリへ接続する手段です。IAMによる権限管理、CloudTrailによる監査、既存のセキュリティポリシーの継続適用が可能で、医療・金融など規制業種でも使いやすい設計になっています。
エージェントのデスクトップ操作コストは現時点で高く、用途を選ぶ必要があります。APIのあるアプリはAPIで操作する方が効率的です。APIを持たないレガシーアプリを自動化したい、かつその業務の価値がコストに見合うと判断できる場面で有力な選択肢になるでしょう。