WWDC 2026でSiriの刷新が話題になるなか、個人開発者が独自のSiri代替エージェントを公開し、翌日にはGitHubでオープンソース化しました。会話の返答をカード型の生成式UIに変換し、スマートホーム操作やナビ、交通チケット確認まで任せられる構成です。
この記事では、開発者A-zhen氏が公開したSiri代替エージェントの仕組みと、iOSアプリ・バックエンドの役割分担、導入の流れを整理します。
この記事でわかること
- Siri代替エージェントが何を実現しているか
- siri-agent-appとclaude-home-agentの2リポジトリ構成
- 生成式UIカードの仕組みと対応できるタスクの範囲
- 公式Siriとの違いと、現時点の制約
WWDC 2026と個人開発のSiri代替が重なった背景
AppleはWWDC 2026でSiriの大幅な刷新を発表しました。クラウド推論にGoogleのGeminiを組み込み、Foundation Modelsフレームワークの拡張やApp Intentsの強化も進めています。新Siriはテキストの羅列ではなく、天気やナビ、チケットなどの情報をカード型UIで返す方向に寄せています。
この流れのなか、開発者A-zhen氏(Xアカウント @40973894)は2026年6月14日、「My own Siri agent, is way better than the real Siri. It can help you do many things.(自分のSiriエージェントは本物のSiriより優れている。多くのことを手伝える)」と投稿し、翌日にオープンソース化すると予告しました。投稿には動画デモが添付され、#agent #siri #wwdc #AI のハッシュタグが付いています。
予告どおり、6月15日にはGitHubユーザー aaaa-zhen 名義で2つのリポジトリが公開されています。フロントエンドの siri-agent-app と、エージェント本体の claude-home-agent です。
siri-agent-appが担う生成式UIフロントエンド
https://github.com/aaaa-zhen/siri-agent-app
siri-agent-appは、Claudeエージェントの返答をiOS 27の新Siriに近い生成式UIで表示するSwiftUIアプリです。長文テキストをそのまま返すのではなく、天気カード、株価カード、ナビ、鉄道チケット、コーヒー注文、ホテル、ファイル、動画など、内容に応じたカードをその場で組み立てます。
READMEによると、主な特徴は次のとおりです。
- 流式の文字表示 — 1文字ずつspringアニメーションで表示し、ブロック間はカスケード表示
- 生成式UIカード — 見出し、リスト、表、コード、数式、コールアウトに加え、専用カードを十数種類用意
- マルチモーダル — 画像を送るとエージェントが内容を読み取って回答
- ファイル・動画 — Excel、Word、PPT、PDFのダウンロードとプレビュー、動画のインライン再生
- 安全なフォールバック — 認識できないコンテンツはテキスト表示に戻し、画面が空白にならない
タイポグラフィの数値は、実際のiOS 27 Siriスクリーンショットから計測した BLOCK-SPECS.md に基づいています。ライセンスはMITです。
ただしREADMEは「early / experimental(初期段階・実験的)」と明記しています。Siri風の生成式UIを個人エージェントに載せる可能性を探るプロトタイプであり、製品版ではない点に注意が必要です。
claude-home-agentが担うエージェントの頭脳
https://github.com/aaaa-zhen/claude-home-agent
エージェントの処理本体は claude-home-agent です。Claude CodeとHome Assistantを組み合わせ、WeChat経由でAI管家(執事)と会話しながら各種タスクを実行します。siri-agent-appはこのエージェントと同じ頭脳を共有するフロントエンドとして設計されています。
READMEに記載された主な機能は次のとおりです。
- スマートホーム — エアコン、照明、HomePod、カーテンの操作と状態確認
- 位置連動ナビ — 現在地GPSを起点にルート検索、周辺店舗検索、高德地図へのディープリンク
- 地理フェンス通知 — 指定場所への到着時にWeChatへ通知
- 配車・交通 — 滴滴(DiDi)の検索・予約・追跡、航空券・新幹線(12306)・天気の照会
- 配送・メディア — 宅配便の料金比較、X・YouTube・抖音リンクからの動画取得とFFmpeg処理
- 記憶とマルチモーダル — セッションをまたいだ嗜好の記憶、画像認識、モデル切り替え
処理の流れは「WeChatメッセージ → weixin-acp → Claude Code CLI → Home Assistant / 各種API → WeChatへ返信」です。CLAUDE.md によるプロンプト設計が中心で、専用の大規模アプリコードよりもエージェント設定とツール連携が本体になっています。
2リポジトリをつなぐアーキテクチャ
全体構成は3層です。
iOS App (SwiftUI)
└─ WebSocket ──▶ agent-server (Node)
└─ ACP ──▶ claude-agent-acp (persistent)
└─ claude-home-agent (CLAUDE.md / memory / tools)
モデルがmarkdownと ::cardName {JSON} 形式のマーカーを出力すると、サーバー側の markdownToBlocks がブロック語彙に変換します。アプリ側の BlockDecoder がデコードし、BlockView が各カードを描画します。
導入の流れは次の3段階です。
- claude-home-agentをサーバーにデプロイし、
claude-agent-acpをインストール - siri-agent-app内の
agent-serverでNode.js接続層を起動(AUTH_TOKENなどを.envに設定) - Xcodeで
agent/Config.swiftにサーバーアドレスとトークンを書き、iOS 26以上の実機でビルド
前提として、Linuxサーバー(1GB VPS可)、Node.js 20+、Python 3.12+、Home Assistant、Claude Code CLI(Anthropic APIキー)が必要です。WeChat連携を使う場合はWeChat PCクライアントも要ります。
公式Siriとの違いと現時点の制約
このプロジェクトの強みは、Appleが示した新SiriのUI思想を個人環境で再現し、Claude Codeのツール実行能力と組み合わせている点です。スマートホーム、配車、交通照会など、会話から実アクションへつながる設計になっています。
一方、READMEが挙げる制約も押さえておく必要があります。
- OSネイティブ連携なし — EventKit、Contacts、Photosへの書き込みはAppleが制限しているため、サービスAPI経由の実装にとどまる
- ストリーミング性能 — 長文返信時のチューニングが未完了
- エラーハンドリング — ファイルダウンロード失敗などがサイレントになる箇所がある
- WebSocket再接続 — 一般的なケースはカバーするが、エッジケースが残る
WWDC 2026では、Foundation Modelsフレームワークのオープンソース化やApp IntentsによるSiri連携強化も発表されています。aaaa-zhen氏のプロジェクトは公式APIを使わず、独自のWebSocket経由でClaudeエージェントと接続するアプローチです。システムレベルでサイドボタン長押しを置き換える公式Extensionsの道とは別ルートであり、個人サーバーとAPIキーを用意できる開発者向けの構成になっています。
自作アシスタントを試すときのポイント
Siri代替エージェントのOSS公開は、WWDC 2026で話題になった生成式UI付きアシスタントを、個人開発者が実用タスク実行までつなげた事例です。siri-agent-appが見た目とカードUIを、claude-home-agentがタスク実行と記憶を担う2リポジトリ構成は、フロントと頭脳を分離する設計として参考になります。実験段階ではあるものの、iOS 26のLiquid Glass APIを使ったSiri風UIとClaude Codeエージェントの組み合わせは、自作アシスタントを試したい読者にとって具体的な出発点になります。