Appleが2年越しで約束した「本物のSiri」が、ついに形になった。
WWDC 2026で発表されたSiri AIは、単なる機能追加ではなく、端末・クラウド・外部インフラを組み合わせた新しいAIアーキテクチャの上に再構築されています。GoogleのGemini技術とNvidiaのGPU、そしてPrivate Cloud Compute(PCC)の拡張が、その背骨です。
この記事でわかること
- Siri AIがどの処理を端末・PCC・Google Cloudのどこで動かすか
- Google Geminiとの共同開発が「Geminiアプリの利用」とは別物である理由
- PCCがAppleデータセンター外へ広がる仕組みとプライバシー設計
- 開発者向けテストの開始時期と利用できる端末の条件
Siri AIは何が変わったか
AppleはSiri AIを「Siriのまったく新しいバージョン」と位置づけています。会話の文脈を保持した対話、画面内のコンテンツへの理解、メッセージやメール、写真を横断するパーソナルコンテキスト検索、Web上の最新情報への回答が加わりました。専用のSiriアプリも新設され、iCloud経由で会話履歴を端末間で同期します。
Craig Federighi氏(ソフトウェアエンジニアリング上級副社長)は、キーノート後の技術セッションで次のように述べています。「Googleアシスタントを使っている部分は、ゼロです」(参考)。Geminiの基盤モデル技術を借りつつも、ユーザーが触れる体験はApple製品のまま、という設計思想がここに表れています。
なぜゼロから作り直したのか
Mike Rockwell氏(エンジニアリング副社長)は、昨年時点で既存Siriの上に積み上げた最初の版が動いていたものの、目指す体験に届かなかったと振り返っています(参考)。より大規模な変更を要する設計に切り替え、Siriを根底から作り直したとのことです。
この判断の結果、音声認識から応答生成までを束ねるSystem Orchestrator(システムオーケストレーター)を中心に、複数のFoundation Modelが連携する構成へ移行しました。クエリの内容に応じて、端末内のモデルかクラウドのモデルかを振り分ける仕組みです。
3層のアーキテクチャ
Siri AIの処理は、大きく3段階に分かれます。
第1層:端末内モデル(AFM Core)
端末で動く主力モデルはAFM Core Advancedと呼ばれ、パラメータ数は200億(従来の30億から大幅に増加)です(参考)。Appleは「scarce model」と呼ぶ手法を採用し、リクエスト全体を解析したうえで必要なパラメータだけを選び、処理中は固定します。トークンごとにパラメータを再読み込みしないため、メモリとバッテリーの負荷を抑えています。
第2層:Private Cloud Compute
端末だけでは処理しきれないリクエストは、AppleのPCCへ送られます。2024年に登場したPCCは、ユーザーデータを保存せず、Appleも第三者もリクエスト内容にアクセスできない設計が前提でした。今回、PCCはApple自社データセンターだけにとどまらず、Google Cloud上へ拡張されます。
第3層:Google Cloud × Nvidia GPU
最も計算量の大きいタスク(エージェント的なツール利用や複雑な推論など)は、Google Cloud上のNvidia GPUで動く大規模モデルが担います。AFM Cloud、AFM Cloud Pro、画像生成向けのADM Cloudなどがここに位置づけられています(参考)。
Googleとの共同開発の実態
Appleのセキュリティブログによれば、次世代のApple Foundation ModelsはGoogleのGeminiファミリーの技術を活用して構築されています。TechRadarの取材では、Foundation Modelの図解上、すべてのモデルがAppleとGoogleの共同開発(青と白の混色)として示され、Apple単独で作ったのはその上に載るシステム層だと説明されています(参考)。
Geminiの最新モデルと共同で作り、将来のGoogle Foundation Modelの成果も取り込む一方、処理パス上でGoogle Geminiアプリが直接応答を返すことはありません。Amar Subramanya氏(AI副社長)は、パートナーの最先端技術を使い、Apple向けにカスタマイズした版を共同構築する、という従来の協業パターンに沿ったと述べています(参考)。
PCCが外部クラウドへ広がる理由と仕組み
AFM Cloud Proのような大規模モデルを動かすには、Nvidiaの最新GPUが必要でした。Subramanya氏は「Nvidiaの最新技術が必要だったため、PCCをサードパーティのクラウドへ拡張する」と説明しています(参考)。
実装面では、Nvidia Confidential Computing(機密計算)、Intel CPUのTDX、GoogleのTitanチップが組み合わされます。AppleのPCC要件——ステートレスな計算、強制可能な保証、特権ランタイムアクセスの禁止、標的化困難性、検証可能な透明性——はそのまま維持されます。インフラのホスト先に関わらず、PCCソフトウェアの完全な制御権はAppleが保持し、端末はAppleが暗号的に承認したソフトウェアだけを信頼します。
さらに、Google Cloud上のPCC向けハードウェアを記録する暗号学的に検証可能な台帳の維持や、サプライチェーン攻撃への対策として複数ベンダーのルートオブトラストを使う設計など、従来の機密計算を超える保護層が追加されています。夏季のプレビュー期間を通じて、保護機能は段階的に有効化される予定です。
使い方と提供スケジュール
Siri AIは2026年6月8日から、iOS 27、iPadOS 27、macOS 27、visionOS 27向けに開発者テストが開始されています。一般ユーザー向けベータは年内の予定で、初期は英語のみ、他言語は順次拡大します。
iPhoneではDynamic Islandから下にスワイプして会話を始められ、MacではSpotlight、Vision Proでは視線だけで起動できます。対応端末はiPhone 16以降、iPhone 15 Pro系、M1以降のiPadやMacなど、Apple Intelligence対応機種が前提です。EUではiOSとiPadOSでは初期提供されず、中国でも規制対応のため提供されません。
従来のSiriとの違い
従来のSiriは、限定的なコマンド実行と短い応答が中心でした。Siri AIは、会話の継続、画面認識、アプリ横断の操作、Web検索を組み合わせた「エージェント的な振る舞い」が標準になります。音声の表現力やディクテーション精度も、最新のオンデバイスモデル対応機種では大幅に向上します。
一方で、クラウド処理の比重が増えた分、プライバシー設計の複雑さも増しています。Appleは端末だけで完結しない処理についても、PCCの原則を外部インフラまで拡張することで、GoogleやNvidiaとの協業とユーザーの信頼の両立を狙っています。2年間の遅延を経て届いたSiri AIは、Appleが「自社だけで全部やる」路線から、厳選したパートナーと共同で基盤を組む転換点でもあります。

