クラウド不要・月額ゼロのAIエージェント Ollama+Hermes導入法

AIを毎月使うたびにクラウドへプロンプトを送り続けることに、違和感を覚え始めた人は多い。

2026年5月、OllamaがOpenClawとHermes Agentを1コマンドで起動できる ollama launch 機能を公式にリリースした。ローカルモデルを使えばプロンプトは手元のマシンの外に出ず、サブスクリプション費用もかからない。クラウドAIと同等の体験を、外部に依存せずに作れるようになった。

この記事でわかること:

Ollama・OpenClaw・Hermes Agentそれぞれの役割と使い分け
ollama launch openclaw / ollama launch hermes コマンドで何が自動化されるか
Hermes Agentのスキル学習・メッセージングプラットフォーム連携・スケジューラの仕組み
ローカルで動かすために必要なVRAMの目安

https://ollama.com

Ollamaが「ローカルAIエージェント」の起点になる

OllamaはオープンソースのローカルLLMランナーで、GemmaやQwenなどのモデルをコマンド1つでダウンロード・実行し、OpenAI互換のAPIをローカルに提供する。

今回のアップデートで、AIエージェントのインストールから設定まで完結する ollama launch 機能が追加された。各エージェントを個別にセットアップする手間が不要になり、モデル選択・プロバイダー設定・ゲートウェイ起動をOllamaが一括で処理する。インストールは1行で済む。

curl -fsSL https://ollama.com/install.sh | sh

`ollama launch openclaw` — コーディングエージェントをローカルに

OpenClawはWhatsApp・Telegram・Slack・Discordなどのメッセージングサービスと、コーディングエージェントを橋渡しするAIアシスタントだ（以前の名称はClawdbot）。

ollama launch openclaw

このコマンドを実行すると、Ollamaが以下を順番に処理する。未インストールの場合はnpm経由でOpenClawを導入し、モデル選択セレクタを表示する。その後、Ollamaのウェブ検索機能（web_search）を有効化し、ゲートウェイデーモンを設定してOpenClaw TUIを起動する。ローカルモデルを選んだ場合、プロンプトは一切外部に送られない。

既存のOpenClawユーザーも、コマンド1つで設定なしにOllamaバックエンドへ切り替えられる。

`ollama launch hermes` — 自己改善するエージェントをローカルに

GitHub - NousResearch/hermes-agent: The agent that grows with you

The agent that grows with you. Contribute to NousResearch/hermes-agent development by creating an account on GitHub.

GitHub

Hermes AgentはNousResearchが開発するOSSのAIエージェントで、「使うほど賢くなる」設計が特徴だ。複雑なタスクをこなした後にその手順をスキルとして自動保存し、次回以降の精度と速度を上げる学習ループを内蔵している。

ollama launch hermes

未インストールであればNousResearchの公式スクリプトが走り、Ollamaのプロバイダー設定（http://127.0.0.1:11434/v1）が自動で書き込まれる。OpenClawからの移行は hermes claw migrate コマンドで設定を引き継げる。

スキル学習

70以上のスキルがデフォルトで同梱されており、追加スキルはオープン標準の agentskills.io から取得できる。タスク完了後にスキルが自動生成・改善されるため、繰り返し使うほど効率が上がる仕組みだ。

メッセージングプラットフォーム連携

Telegram・Discord・Slack・WhatsApp・Signal・Emailのゲートウェイを一括管理できる。スマートフォンのTelegramからHermesに指示を出し、自宅サーバーやVMで処理させることも可能だ。CLIと同じスラッシュコマンドがそのままメッセージングアプリでも使える。

スケジューラ

「毎朝8時にレポートをまとめてTelegramに送る」といった自然言語の指示がそのままcronジョブとして動く。コードを書かずに定期バッチを定義できる。

クロスセッション記憶

FTS5全文検索と Honcho によるユーザーモデリングを組み合わせ、セッションをまたいで過去の会話を参照する。同じ背景説明を繰り返す手間がなくなる。

ローカルで動かすために必要なスペック

OpenClawとHermes Agentはどちらも最低64,000トークンのコンテキストウィンドウを必要とする。Ollamaのローカルモデルで使う場合は --ctx-size 65536 相当の設定が必須だ。

Ollamaが推奨するローカルモデルの目安:

モデル	VRAM目安	特徴
gemma4	約16GB	推論・コード生成
qwen3.5	約11GB	推論・コーディング・ビジョン
qwen3.6	約24GB	より高精度な推論

VRAMが不足する場合、OllamaはCloud Models（kimi-k2.5:cloud、qwen3.5:cloudなど）も用意している。この場合プロンプトはOllamaのクラウドを通るが、OpenAIやAnthropicのサーバーには送られない。完全なオフライン動作にこだわる場合はローカルモデルを選ぶ。

料金

Ollamaのローカル利用は無料だ。クラウドモデルを使う場合は月額20ドル（Proプラン）または100ドル（Maxプラン）がかかる。Proは同時3クラウドモデル、Maxは最大10モデルの並列実行が可能だ。OpenClawとHermes Agent本体はオープンソースのため、追加のライセンス費用はない。

OpenClawとHermes Agentの使い分け

コーディング支援に特化した用途や、既存のメッセージングアプリをそのまま窓口にしたい場合はOpenClawが軽量な選択肢になる。長期記憶・自動スキル学習・スケジューラ・マルチプラットフォームゲートウェイが必要なら、Hermes Agentが機能面で上回る。どちらもOllama経由でセットアップできるため、まずOpenClawを試してみて、機能が物足りなくなったら hermes claw migrate でHermesに移行するという段階的な使い方が現実的だ。