AIエージェントに仕事を任せたのに、途中で止まっていた——そんな経験を持つ人は多い。

Nous Researchが開発するOSSエージェント「Hermes Agent」がv0.13.0をリリースした。”The Tenacity Release”(粘り強さのリリース)と名付けられた今回の更新は、エージェントが「最後まで仕事を終える」ことを設計の中心に置いている。

この記事でわかること:

  • マルチエージェントKanbanが実用レベルに完成した経緯と使い方
  • /goalコマンドでエージェントがターゲットを忘れなくなる仕組み
  • セキュリティ8件修正の内容と影響
  • その他の主要変更点(動画解析、ボイスクローニング、7言語対応)
  • v0.12.0からのアップデート方法

v0.12.0からの変化量

v0.12.0のリリースからv0.13.0まで、864件のコミット、588件のマージ済みPR、829ファイルの変更が積み重なった。282件のissueが解消され、そのうち13件はP0(最優先バグ)だった。295名のコミュニティコントリビューターが参加しており、GitHubスター数は現在13.8万を超えている。

v0.12.0では「The Curator Release」として自律スキル管理エージェントが主役だった。今回はその土台を前提に、マルチエージェント協調の安定性とセキュリティを一段引き上げた内容になっている。

マルチエージェントKanbanが本番稼働水準に

今回の目玉は、マルチエージェントKanbanボードの完成だ。

Kanban機能自体はv0.12.0の段階で実験的に実装されていたが、ワーカーが途中で止まる、セッション再起動後にタスク状態が失われるなどの問題があった。v0.13.0ではこれを「耐久性あるボード(durable board)」として作り直した。

具体的には次の仕組みが加わっている。ワーカーが生きているか確認するハートビート、タイムアウトしたタスクを他のワーカーが引き継ぐreclaim機能、応答しなくなったゾンビワーカーの検出、タスクごとの再試行上限設定、そしてワーカーが「作業完了した」と虚偽申告しないかを確認するハルシネーションゲートだ。

使い方はシンプルで、Kanbanボードを作成してタスクを投入すれば、複数のHermesワーカーが自律的にタスクを拾い上げ、完了まで処理する。1つのインストールで複数のボードを管理でき、プロファイル間でのボード共有も可能になった。

/goalでエージェントがターゲットを忘れない

複数ターンにわたる作業でエージェントが本来の目標から外れることを防ぐ/goalコマンドが追加された。

「Ralph loop」と呼ばれる実装で、設定したゴールはセッションを通じて保持され続ける。エージェントが脱線しかけるたびにゴールに引き戻す仕組みだ。長時間の自律タスクや、複数のサブタスクをこなしながら最終目標を維持させたい場面で効果を発揮する。

また、Checkpoints v2として状態の永続化ロジックが全面的に書き直された。古い実装では不要なデータが蓄積してディスクを圧迫する問題があったが、今回から実際のプルーニングとディスク使用量の上限管理が導入された。

ゲートウェイが再起動した場合も、セッションは自動的に再開されるようになっている。/update実行時やソースファイルのリロード時も対象だ。

セキュリティ8件のP0修正

セキュリティ面では8件のP0(最優先)脆弱性が修正された。主なものを挙げる。

シークレットの自動隠蔽がデフォルトONに変わった。 以前はオプト・インだったredaction機能が、今回から標準で有効になっている。APIキーやトークンが誤って出力に含まれるリスクが下がる。

Discordのロール許可設定がギルド単位に変わった。 CVSS 8.1と評価されていた脆弱性で、別のギルドからDMを送られた際に権限が誤って引き継がれる問題が修正された。

WhatsAppがデフォルトで見知らぬ相手を拒否するようになった。 設定で許可リストに追加した相手以外からのメッセージを処理しない。

その他、auth.jsonとMCP OAuthの書き込み時にTOCTOU(Time-of-check to time-of-use)の競合ウィンドウが閉じられ、ブラウザのクラウドメタデータSSRF対策も強化された。cronスケジューラがスキルコンテンツを含むプロンプトへのインジェクション検査も行うようになっている。

動画解析・ボイスクローニング・7言語対応

機能面での追加点も複数ある。

video_analyzeツールが追加され、GeminiやマルチモーダルモデルでHermes Agentが直接動画を解析できるようになった。テキスト・画像・音声に続いて動画が扱えるインプットに加わった形だ。

xAI Custom VoicesがTTSプロバイダーとして統合され、声のクローニングに対応した。複数のTTSバックエンドを切り替える用途でも使える。

インターフェースの言語対応として、静的メッセージとCLIが中国語・日本語・ドイツ語・スペイン語・フランス語・ウクライナ語・トルコ語の7言語に翻訳された。ドキュメントサイトも中国語(簡体字)ロケールが追加されている。

メッセージングプラットフォームはGoogle Chatが追加されて20番目になった。同時に、プラットフォームをプラグインとして差し込む汎用フックが整備され、IRCとTeamsがこの仕組みに移行した。

新モデルとしてdeepseek/deepseek-v4-prox-ai/grok-4.3openrouter/owl-alpha(無料)、tencent/hy3-previewが追加されている。

アップデート方法

既存のインストール済み環境は次のコマンドで更新できる。

hermes update

未インストールの場合は以下のコマンドから始める。LinuxとmacOS、WSL2に対応している。

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

まとめ

v0.13.0の一貫したテーマは「途中で止まらない」ことだ。Kanbanのゾンビ検出から/goalの永続ゴール、セッション再起動後の自動再開まで、すべてがエージェントの継続性を高める方向に向かっている。

並行して、デフォルトの安全設定を引き上げることで、誤設定による情報漏えいリスクも減らした。機能追加と安全性強化が同時に進んでいる点は、OSSエージェントとしての成熟を示している。