新Siri AIの仕組み GoogleとNvidiaが支える3層設計

Appleが2年越しで約束した「本物のSiri」が、ついに形になった。

WWDC 2026で発表されたSiri AIは、単なる機能追加ではなく、端末・クラウド・外部インフラを組み合わせた新しいAIアーキテクチャの上に再構築されています。GoogleのGemini技術とNvidiaのGPU、そしてPrivate Cloud Compute（PCC）の拡張が、その背骨です。

この記事でわかること

Siri AIがどの処理を端末・PCC・Google Cloudのどこで動かすか
Google Geminiとの共同開発が「Geminiアプリの利用」とは別物である理由
PCCがAppleデータセンター外へ広がる仕組みとプライバシー設計
開発者向けテストの開始時期と利用できる端末の条件

Siri AIは何が変わったか

Apple introduces Siri AI, a profoundly more capable and personal assistant

Apple introduces Siri AI, a profoundly more capable and personal assistant powered by Apple Intelligence, with personal …

Apple Newsroom

AppleはSiri AIを「Siriのまったく新しいバージョン」と位置づけています。会話の文脈を保持した対話、画面内のコンテンツへの理解、メッセージやメール、写真を横断するパーソナルコンテキスト検索、Web上の最新情報への回答が加わりました。専用のSiriアプリも新設され、iCloud経由で会話履歴を端末間で同期します。

Craig Federighi氏（ソフトウェアエンジニアリング上級副社長）は、キーノート後の技術セッションで次のように述べています。「Googleアシスタントを使っている部分は、ゼロです」（参考）。Geminiの基盤モデル技術を借りつつも、ユーザーが触れる体験はApple製品のまま、という設計思想がここに表れています。

なぜゼロから作り直したのか

Mike Rockwell氏（エンジニアリング副社長）は、昨年時点で既存Siriの上に積み上げた最初の版が動いていたものの、目指す体験に届かなかったと振り返っています（参考）。より大規模な変更を要する設計に切り替え、Siriを根底から作り直したとのことです。

この判断の結果、音声認識から応答生成までを束ねるSystem Orchestrator（システムオーケストレーター）を中心に、複数のFoundation Modelが連携する構成へ移行しました。クエリの内容に応じて、端末内のモデルかクラウドのモデルかを振り分ける仕組みです。

3層のアーキテクチャ

Siri AIの処理は、大きく3段階に分かれます。

第1層：端末内モデル（AFM Core）

端末で動く主力モデルはAFM Core Advancedと呼ばれ、パラメータ数は200億（従来の30億から大幅に増加）です（参考）。Appleは「scarce model」と呼ぶ手法を採用し、リクエスト全体を解析したうえで必要なパラメータだけを選び、処理中は固定します。トークンごとにパラメータを再読み込みしないため、メモリとバッテリーの負荷を抑えています。

第2層：Private Cloud Compute

端末だけでは処理しきれないリクエストは、AppleのPCCへ送られます。2024年に登場したPCCは、ユーザーデータを保存せず、Appleも第三者もリクエスト内容にアクセスできない設計が前提でした。今回、PCCはApple自社データセンターだけにとどまらず、Google Cloud上へ拡張されます。

第3層：Google Cloud × Nvidia GPU

最も計算量の大きいタスク（エージェント的なツール利用や複雑な推論など）は、Google Cloud上のNvidia GPUで動く大規模モデルが担います。AFM Cloud、AFM Cloud Pro、画像生成向けのADM Cloudなどがここに位置づけられています（参考）。

Googleとの共同開発の実態

Expanding Private Cloud Compute - Apple Security Research

Alongside the next generation of Apple Intelligence, today we’re expanding Private Cloud Compute (PCC) beyond Apple’s da…

Expanding Private Cloud Compute - Apple Security Research

Appleのセキュリティブログによれば、次世代のApple Foundation ModelsはGoogleのGeminiファミリーの技術を活用して構築されています。TechRadarの取材では、Foundation Modelの図解上、すべてのモデルがAppleとGoogleの共同開発（青と白の混色）として示され、Apple単独で作ったのはその上に載るシステム層だと説明されています（参考）。

Geminiの最新モデルと共同で作り、将来のGoogle Foundation Modelの成果も取り込む一方、処理パス上でGoogle Geminiアプリが直接応答を返すことはありません。Amar Subramanya氏（AI副社長）は、パートナーの最先端技術を使い、Apple向けにカスタマイズした版を共同構築する、という従来の協業パターンに沿ったと述べています（参考）。

PCCが外部クラウドへ広がる理由と仕組み

AFM Cloud Proのような大規模モデルを動かすには、Nvidiaの最新GPUが必要でした。Subramanya氏は「Nvidiaの最新技術が必要だったため、PCCをサードパーティのクラウドへ拡張する」と説明しています（参考）。

実装面では、Nvidia Confidential Computing（機密計算）、Intel CPUのTDX、GoogleのTitanチップが組み合わされます。AppleのPCC要件——ステートレスな計算、強制可能な保証、特権ランタイムアクセスの禁止、標的化困難性、検証可能な透明性——はそのまま維持されます。インフラのホスト先に関わらず、PCCソフトウェアの完全な制御権はAppleが保持し、端末はAppleが暗号的に承認したソフトウェアだけを信頼します。

さらに、Google Cloud上のPCC向けハードウェアを記録する暗号学的に検証可能な台帳の維持や、サプライチェーン攻撃への対策として複数ベンダーのルートオブトラストを使う設計など、従来の機密計算を超える保護層が追加されています。夏季のプレビュー期間を通じて、保護機能は段階的に有効化される予定です。

使い方と提供スケジュール

Siri AIは2026年6月8日から、iOS 27、iPadOS 27、macOS 27、visionOS 27向けに開発者テストが開始されています。一般ユーザー向けベータは年内の予定で、初期は英語のみ、他言語は順次拡大します。

iPhoneではDynamic Islandから下にスワイプして会話を始められ、MacではSpotlight、Vision Proでは視線だけで起動できます。対応端末はiPhone 16以降、iPhone 15 Pro系、M1以降のiPadやMacなど、Apple Intelligence対応機種が前提です。EUではiOSとiPadOSでは初期提供されず、中国でも規制対応のため提供されません。

従来のSiriとの違い

従来のSiriは、限定的なコマンド実行と短い応答が中心でした。Siri AIは、会話の継続、画面認識、アプリ横断の操作、Web検索を組み合わせた「エージェント的な振る舞い」が標準になります。音声の表現力やディクテーション精度も、最新のオンデバイスモデル対応機種では大幅に向上します。

一方で、クラウド処理の比重が増えた分、プライバシー設計の複雑さも増しています。Appleは端末だけで完結しない処理についても、PCCの原則を外部インフラまで拡張することで、GoogleやNvidiaとの協業とユーザーの信頼の両立を狙っています。2年間の遅延を経て届いたSiri AIは、Appleが「自社だけで全部やる」路線から、厳選したパートナーと共同で基盤を組む転換点でもあります。