AIエージェントで文書を生成するとき、ファイル形式の選択が後の編集コストに影響することがある。Agent ZeroはLibreOfficeをバックエンドに文書を作成するが、v1.12まではOOXML(DOCX/XLSX/PPTX)がデフォルト形式だった。LibreOfficeはODF(ODT/ODS/ODP)を標準とするため、OOXMLを使い続けると微妙な互換性の問題が出やすかった。

2026年5月5日にリリースされたv1.13でこの設計が変わった。ODF形式が標準出力になり、ブラウザモーダルの切り替えが安定化、Linuxデスクトップのセッションが永続化するなど14件の変更が加わっている。

この記事でわかること:

  • v1.13でODF形式が標準になった背景と変更内容
  • ブラウザ切り替えが安定化した仕組み
  • Linuxデスクトップのライフサイクル改善
  • UIとインフラ周りの更新点

https://github.com/agent0ai/agent-zero

Agent Zeroとは

Agent Zeroは、コード実行・ブラウザ操作・デスクトップ自動化を組み合わせて複雑なタスクを実行できるオープンソースのAIエージェントフレームワークだ。GitHubで17,500スター超、Dockerコンテナで動作し、OpenAI・Anthropic・Grok・ローカルモデル(Ollama経由)など主要LLMプロバイダーすべてに対応している。

主エージェントが複雑なタスクをサブエージェントに分割して並行処理できる「マルチエージェント階層」が特徴で、プラグインによる機能拡張、セッションを跨いだメモリの保持にも対応する。

直近のバージョンでは文書とブラウザ自動化の強化が続いており、v1.10でPlaywright製の組み込みブラウザ、v1.11でLibreOfficeバックエンドのデスクトップランタイムが追加された。v1.13はその流れを引き継ぎ、形式の統一と操作の安定化を進めるリリースだ。

ODFが新しい標準形式に

v1.13の最大の変更は、文書の出力形式をODF(Open Document Format)に切り替えたことだ。

文書の種類 v1.12以前のデフォルト v1.13以降のデフォルト
テキスト文書 DOCX ODT
スプレッドシート XLSX ODS
プレゼンテーション PPTX ODP

OOXMLは「明示的な互換性オプション」として引き続き選択可能だ。ODFフルパッケージの生成・バリデーション・読み込み・編集がネイティブでサポートされる。

あわせて、ファイルヘッダーがキャンバス表示とモーダル表示の両方で統一され、「+新規」メニュー、インラインの保存、ドロップダウンからのファイル名変更・クローズが使えるようになった。LibreOfficeが生成した文書は、編集後にウィンドウを閉じて再開く形でライブリロードされる仕組みになっており、キャンバスの再描画に依存していた以前の挙動が改善されている。

メタ的な会話(「さっき生成したファイルについて」といった議論)でアーティファクトが自動生成される問題も修正された。明示的なキャンバス操作や直接のファイル指定でのみ文書が作成される。

ブラウザ切り替えの安定化

v1.12まで、デスクトップ画面からブラウザモーダルに切り替えると空のタブが開くことがあった。v1.13では既存セッションを再利用する形に改められ、切り替えのたびに状態がリセットされる問題が解消されている。

ブラウザモーダルのヘッダーにフォーカスモードのコントロールが追加され、デスクトップのフルスクリーン・復元操作と統一された操作感になった。スクリーンショットについては、browser:screenshot アクションでJPEGまたはPNG形式のファイルを書き出せるようになり、vision_load で読み込める。ラベル付きフォームコントロール向けのエージェント呼び出しアクションも拡張されている。

Linuxデスクトップの永続化

Xpra(Linux向けリモートデスクトップサーバー)で動くXFCEデスクトップのiframeが、キャンバス・モーダル・キープアライブの間を通して単一セッションとして維持されるようになった。以前はコンテキストの切り替えでデスクトップセッションが失われることがあった。

シャットダウンとクラッシュが明確に区別されるようになり、XFCEパネルに「Shutdown Desktop」ランチャーが追加された(実行には確認クリックが必要)。ロック・ユーザー切り替えといったデスクトップのUI要素は非表示になっている。

デスクトップ操作のガイダンスも整理されており、シェルプロンプトとターゲットCLIプロンプトが区別されるようになった。エージェントがアプリのキーボード操作を優先し、座標クリックを最終手段として扱う方針に明確化されている。

UIとインフラの更新

キャンバス右パネルはこれまで最大幅に上限があったが、この制限が撤廃された。ゼロ幅から画面全体まで自由にリサイズでき、表示したいコンテンツに応じてレイアウトを調整できる。

チャット入力欄には矢印キー(↑/↓)による入力履歴ナビゲーションが追加された。Bashのコマンド履歴と同じ操作感で過去の入力を呼び出せる。なお、下矢印キーはカーソルがテキスト末尾にあるときのみ履歴を移動し、通常の複数行テキスト内での改行移動は従来通り動作する(コミュニティコントリビューション)。

Time Travelモーダルはセンタリングされた標準のモーダルシェルを使うように変更されており、設定画面との見た目が統一された。

Dockerビルドの問題については、pyreqwest-impersonate ライブラリのバージョンを0.5.3に固定することで、cmake のコンパイルが必要な0.5.5へ自動更新されてビルドが失敗する問題が解消されている。

Agent Zero v1.13のリリースノートはGitHubで公開されている(agent0ai/agent-zero v1.13)。導入はDockerで1コマンドから可能だ。