あなたが会議中に話しかけると、AIがすぐに応答する——OpenClawがGoogle Meetでそれを実現しました。
2026年5月5日、オープンソースのパーソナルAIアシスタント「OpenClaw」がバージョン2026.5.4をリリースしました。今回のハイライトとして挙げられているのは、Google MeetのTwilio通話にGeminiリアルタイム音声ブリッジを組み込む機能です。
この記事でわかること:
- Google Meet × Gemini音声ブリッジで何ができるか
- v2026.5.4のその他の主要変更点
- v2026.5.3からのアップデート手順
https://github.com/openclaw/openclaw/releases/tag/v2026.5.4
OpenClawとは
OpenClawは自分のデバイス上で動かすオープンソースのパーソナルAIアシスタントです。WhatsApp・Telegram・Slack・Discord・Google Chatをはじめとする20以上のメッセージングチャンネルに対応しており、普段使っているプラットフォームでAIとやりとりできます。
MITライセンスで公開されており、GitHubスター数は2026年3月に25万を突破しました。OpenAI・GitHub・NVIDIAがスポンサーに名を連ねる大型OSSプロジェクトです。
目玉変更:Google MeetにGemini音声ブリッジが入った
v2026.5.4の最大の変更は、Google Meet(Twilio経由)のダイアルイン通話にGeminiのリアルタイム音声ブリッジを適用できるようになったことです。
これまで、TwilioがMeet通話に参加する際はTwiMLを使った音声処理を経由するため、応答の遅延が生じやすい構造でした。v2026.5.4ではTwilioの通話音声を直接Geminiのリアルタイム音声処理に渡すよう変更されています。
具体的には4つの改善が施されています。
ペーシング付き音声ストリーミング:音声データをバーストさせず均等に流すことで、遅延の原因となるスパイクを抑えます。
バックプレッシャーバッファリング:処理が追いつかない場合にストリームを詰まらせない制御が入り、接続が安定します。
割り込み(barge-in)キューのクリア:ユーザーが話しかけた瞬間にエージェントの発話を停止し、割り込み応答へ素早く移行します。
TwiMLフォールバックの廃止:リアルタイム音声処理中はTwiMLへ戻らないようにし、応答の一貫性を保ちます。
これらの変更により、Google Meetに参加しているOpenClawの音声エージェントの応答が体感レベルで速くなります。
Codexで音声文字起こしが使えるようになった
OpenAI/Codexのメディア対応も強化されました。Codexの音声文字起こし(transcription)がランタイムとマニフェストメタデータに追加され、アクティブなCodexチャットモデルがOpenAIのデフォルト文字起こしルートを経由するようになります。
以前は、CodexのモデルIDを音声文字起こし用途に指定すると、チャット用のモデルIDがそのまま音声APIに渡されて正しく動作しないケースがありました。v2026.5.4では適切なルーティングに修正されており、Codexモデルを通じた音声入力が安定して機能します。
Discordトークン解決のバグ修正
v2026.5.3で発生していたDiscordのトークン解決問題が修正されました。
v2026.5.3から、Discordなどの外部チャンネルプラグインはnpmパッケージとして分離されています。コンパイル済みファイルがdist/ディレクトリに置かれますが、Secret解決ロジックがこのパスを探索していなかったため、channels.discord.tokenのSecretRef設定が「not configured」として扱われるケースがありました。v2026.5.4では<rootDir>/dist/も探索対象に加わり、この問題が解消されています。v2026.5.3へのアップグレード後にDiscordが接続できなくなったユーザーはこの修正で解決します。
認証プロファイルを確認する新コマンド
openclaw models auth listコマンドが追加されました。
openclaw models auth list [--provider <id>] [--json]
エージェントごとに保存された認証プロファイルを、シークレット情報を出力せずに確認できます。--providerでプロバイダーを絞り込み、--jsonでJSON出力も可能です。これまで保存済みの認証情報を確認するには設定ファイルを直接参照するしかなく、煩雑でした。このコマンドで運用時の確認作業が大きく楽になります。
WindowsのIPv6バインド問題を修正
Windowsでゲートウェイのデフォルトループバックリスナーが::1(IPv6)にも束縛され、localhostへのHTTPリクエストが詰まるケースがありました。これはlibuvのデュアルスタック挙動に起因するものです。v2026.5.4では127.0.0.1(IPv4)にのみバインドするよう変更されており、Windowsでのゲートウェイ起動が安定します。
ダッシュボードのUI改善
コントロールUIにも変更が入りました。ヘッダーのパンくずリストにアクティブなエージェント名が表示されるようになり、複数エージェントを切り替えながら作業する際に現在の操作対象が一目でわかります。
クーロン(定期タスク)の管理画面では「New Job」サイドバーが折りたたみ可能になりました。ジョブ数が増えてきたときに一覧を広いスペースで確認でき、フォームを開くのは必要なときだけに絞れます。
v2026.5.4へのアップデート
npmまたはpnpmでインストール済みの場合は以下のコマンドでアップデートします。
npm install -g openclaw@latest
# または
pnpm add -g openclaw@latest
アップデート後はopenclaw doctorを実行すると設定の整合性を確認できます。詳細な手順は公式ドキュメントのUpdatingを参照してください。