ログイン済みのChromeを使って、AIエージェントにXやRedditを操作させたい——そんな用途を、ターミナル1本で実現するOSSがGitHubでスターを急増させています。

OpenCLIは、WebサイトやElectronアプリをCLIインターフェースに変換し、Claude CodeやCursorなどのAIエージェントが自然言語の指示でそれらを操作できる環境を整えるツールです。2026年4月25日にv1.7.8がリリースされており、GitHubスターは17,500超に達しています。

この記事でわかること:

  • OpenCLIの概要とどんな課題を解決するか
  • 90以上の内蔵アダプターとAIエージェント向けブラウザ自動化の仕組み
  • Claude CodeへのスキルインストールとAIへの指示の出し方
  • Electron製デスクトップアプリを端末から操作する方法
  • インストール手順と使い始めの流れ

AIエージェントとWebの間にある壁

AIエージェントにWebサービスを操作させようとすると、ログイン情報の扱い、DOMの構造の変化、ネットワーク認証など、乗り越えるべき壁がいくつもあります。従来は自前でPlaywrightやPuppeteerのスクリプトを書く必要があり、サイトが更新されるたびにメンテナンスが必要でした。

OpenCLIはこの問題を「自分がすでにChromeにログインしている状態を再利用する」という方針で解決します。別途ログイン情報を渡す必要がなく、認証済みのセッションをそのままエージェントに使わせます。

3つの用途

OpenCLIには、大きく分けて3つの使い方があります。

内蔵アダプターをそのまま使う

opencli hackernews topopencli reddit hotのように、対応サイト向けのコマンドがそのまま使えます。対応サイトは90以上あり、Bilibili、Reddit、HackerNews、Twitter/X、Zhihuなどが含まれます。ブラウザなしで動作するため、CI環境やシェルスクリプトとの組み合わせにも向いています。出力スキーマが固定されているため、同じコマンドを何度実行しても同じ形式のデータが返ります。

AIエージェントに任意のサイトを操作させる

Claude CodeやCursorにopencli-adapter-authorスキルをインストールすると、エージェントは自然言語の指示でChromeを操作できるようになります。ナビゲーション、クリック、フォーム入力、DOM抽出、ネットワーク傍受まで、画面操作の一連の流れをエージェントが自律的に処理します。

例えば「小紅書の通知を確認して」と指示するだけで、opencli browser openstateclickといったブラウザコマンドをエージェントが自動で組み合わせて実行します。DOMのスナップショットをベースにしているため、スクリーンショットを毎回解析するより高速で、運用時にLLMのトークンを消費しません。

デスクトップアプリを端末から操作する

CDP(Chrome DevTools Protocol)を経由して、CursorやChatGPT、Notion、CodexといったElectronアプリをターミナルから直接制御できます。ブラウザとデスクトップアプリの両方を同じCLIから扱える点が、他のブラウザ自動化ツールとの大きな違いです。

インストールと初期設定

Node.js 21.0.0以上が必要です。npmでグローバルインストールします。

npm install -g @jackwener/opencli

続けて、ChromeとOpenCLIをつなぐ「Browser Bridge」拡張をインストールします。Chrome Web Storeから「OpenCLI」を検索してインストールするのが最も簡単です。拡張を入れると、ローカルのデーモンプロセスが自動的に起動します。

インストール後は次のコマンドで動作確認します。

opencli doctor

問題がなければ、コマンドを試せます。

opencli list
opencli hackernews top --limit 5
opencli bilibili hot --limit 5

AIエージェントへのスキル統合

Claude CodeやCursorに組み込む場合は、npx skillsでスキルを追加します。

npx skills add jackwener/opencli

必要なスキルだけ選ぶことも可能です。

npx skills add jackwener/opencli --skill opencli-adapter-author
npx skills add jackwener/opencli --skill opencli-browser

用意されているスキルは5種類あります。

スキル 用途
opencli-adapter-author 任意サイトのリアルタイム操作、新規アダプター作成
opencli-autofix 内蔵コマンドが壊れたときの自動修復
opencli-browser ブラウザ自動化のリファレンス
opencli-usage 全コマンド・サイトのクイックリファレンス
smart-search 既存アダプターの検索

スキルをインストールした後は、エージェントに自然言語で指示するだけです。ブラウザコマンドの詳細を把握していなくても、エージェントが内部で適切な操作を組み立てます。

対応していないサイトへの対処

内蔵アダプターにないサイトに対しては、opencli-adapter-authorスキルを使ってアダプターをゼロから作成できます。エージェントがサイトのパターン分類(SPA / SSR / JSONP / Token / Streaming)からAPIエンドポイントの特定、認証戦略の選定まで順番にこなします。完成したアダプターはopencli browser verifyで動作確認し、サイト情報は~/.opencli/sites/<site>/にキャッシュされます。同じサイトの2本目のアダプターを作るときは、キャッシュを活用して工程を短縮できます。

注意点

ブラウザを使うコマンドは、Chromeがすでに起動していてそのサイトにログインしていることが前提です。未認証の状態では空のデータが返ります。ブラウザへの接続待機時間はデフォルト30秒(OPENCLI_BROWSER_CONNECT_TIMEOUT)で、重いサイトでは延長が必要になる場合があります。

Playwright MCPやdev-browserなど既存のブラウザ自動化ツールがスクリーンショットベースの認識を使うのに対し、OpenCLIは構造化されたDOMスナップショットを使います。認識精度が画像解析に依存しないため、UIの細かい変化に強く、実行コストも低く抑えられます。

まとめ

OpenCLI(v1.7.8、GitHubスター17,500超)は、90以上の内蔵アダプターとAIエージェント向けブラウザ自動化を組み合わせたCLIハブです。ログイン済みのChromeセッションを再利用するため認証処理をエージェントに渡す必要がなく、運用時のLLMコストもかかりません。Claude CodeやCursorへのスキル統合はnpx skills add jackwener/opencliの1コマンドで完了し、その後は自然言語での指示だけでWebサイトやデスクトップアプリを操作できます。