AIアシスタントにコードベースを探索させると、Grep・Globのたびに大量のトークンが消える。ファイルを丸ごと渡せばコストはさらに膨れ上がる。
graphifyは、任意のフォルダのコード・ドキュメント・PDF・画像・動画をまとめて処理し、クエリ可能な知識グラフを生成するOSSスキルだ。Claude Code、Codex、Cursor、Gemini CLIなど15以上のAIコーディングアシスタントに対応し、/graphify .の一コマンドで動く。GitHubスター数は37,500超(2026年4月時点)、ライセンスはMITだ。
この記事でわかること:
- graphifyが解決する課題と3パス処理の仕組み
- トークンを71.5倍削減できる根拠
- インストール手順と主要コマンドの使い方
- チーム共有とMCP連携の方法
https://github.com/safishamsi/graphify
graphifyが解決する問題
大きなコードベースやドキュメント群をAIエージェントに渡す方法は、これまで「ファイルをそのまま流し込む」か「Grep/Globで逐次検索する」しかなかった。前者はトークンコストが膨大になり、後者はファイル間の関係性を見落とす。
Andrej Karpathyは「論文・ツイート・スクリーンショット・ノートを投げ込む/rawフォルダを持っている」と話していたが、そういった雑多なインプットから構造を引き出す仕組みがなかった。graphifyはこの問題を直接解くことを目標に設計されている。
Karpathyのリポジトリ群+論文5本+画像4枚(計52ファイル)でのベンチマークでは、生ファイルを読む場合に比べてクエリあたりのトークン数が71.5分の1になったとREADMEに記載されている。初回のグラフ構築時にLLM呼び出しが発生するが、それ以降のクエリはSHA256キャッシュ済みのgraph.jsonを参照するだけになる。
3パスで動く処理の仕組み
graphifyはファイルを3段階で処理する。
第1パスはコードファイルをtree-sitter ASTで処理する。LLMは不要で、クラス・関数・インポート・呼び出しグラフ・ドキュメント文字列を確定的に抽出する。Python、TypeScript、Go、Rust、Javaなど25言語に対応し、コードの内容はLLMに送られない。
第2パスは動画・音声ファイルをfaster-whisperでローカルトランスクリプト化する。グラフから抽出したコアコンセプトを使ってドメイン固有の転写プロンプトを組み立てるため、技術用語の精度が高い。音声データは端末の外に出ない。
第3パスはドキュメント・PDF・画像・トランスクリプトに対してClaudeのサブエージェントを並列実行し、概念・関係性・設計意図を抽出する。抽出結果をNetworkXグラフにマージし、Leiden法でコミュニティ検出を行ったうえで出力する。クラスタリングに埋め込みやベクターデータベースは使わない。Claudeが抽出した意味的類似エッジがグラフの構造として既に入っているため、グラフの構造そのものが類似度信号になる。
すべての関係性はEXTRACTED(ソースから直接発見)、INFERRED(推論、信頼スコア付き)、AMBIGUOUS(要確認)の3タグで区別される。AIが「見つけたもの」と「推測したもの」を明示的に分けられる点が設計上の特徴だ。
実行後に生成されるファイル
/graphify .を実行すると、graphify-out/ディレクトリに以下のファイルが出力される。
graph.htmlはブラウザで開けるインタラクティブグラフで、ノードのクリック・検索・コミュニティフィルタが使える。GRAPH_REPORT.mdはゴッドノード(全体のハブになる中心概念)・驚くべき接続・推奨クエリを一ページにまとめたサマリーだ。graph.jsonはセッションをまたいで永続するグラフデータで、後からいつでもクエリできる。cache/はSHA256キャッシュで、再実行時には変更されたファイルだけを処理する。
Clause Code向けにgraphify claude installを実行すると、CLAUDE.mdへの記載とPreToolUseフックが追加され、Grep・Globが呼ばれる前に知識グラフを参照するようClaude Codeへ自動的に指示が入る。ファイルをgrepで探すのではなく、グラフの構造を使って目的のコードに辿り着く動作に変わる。
インストール手順
Python 3.10以上が必要だ。PyPIパッケージ名はgraphifyy(末尾にyが2つ)で、graphifyという別の無関係なパッケージと混同しないよう注意が必要だ。
# 推奨(Mac/Linux)
uv tool install graphifyy && graphify install
# または
pipx install graphifyy && graphify install
Claude Code以外のプラットフォームへの対応は--platformオプションで指定する。Codexならgraphify install --platform codex、OpenClawならgraphify install --platform clawといった形だ。
インストール後、AIアシスタントで/graphify .と入力するだけでカレントディレクトリを処理できる。特定のフォルダは/graphify ./docsのように指定し、変更されたファイルだけを再処理するには/graphify . --updateを使う。
主要コマンド
グラフ構築後は複数のサブコマンドでグラフを活用できる。
/graphify queryは自然言語でグラフにクエリを投げる。「attentionとオプティマイザーをつなぐものは何か」のような質問に、グラフのノードとエッジを根拠にして答える。/graphify pathは2つのノード間の最短パスを探し、/graphify explainは指定したノードを平易な言葉で説明する。
GitHubリポジトリをまるごとグラフ化するgraphify clone <URL>、複数プロジェクトのgraph.jsonを統合して横断的な依存関係を可視化するgraphify merge-graphsもv0.5.0で追加されている。
MCPサーバーとして起動する場合はpython -m graphify.serve graphify-out/graph.jsonを実行する。query_graph・get_node・get_neighbors・shortest_pathの4ツールが使える。
料金とライセンス
graphify本体はMITライセンスのOSSで無料だ。APIコストは使用するAIコーディングアシスタントの契約に準じる。セマンティック抽出のLLM呼び出しは初回グラフ構築時のみで、以降のクエリは追加のAPIコストがかからない。動画・音声トランスクリプトはfaster-whisperによるローカル処理なので、この部分もAPIコストは発生しない。
チームで使う場合はgraphify-out/cache/とgraphify-out/manifest.jsonを.gitignoreに追加しつつ、グラフ本体をgitにコミットして共有できる。メンバーはチェックアウト後すぐにGRAPH_REPORT.mdを参照でき、グラフ構築のコストを1人分に抑えられる。
graphifyの上位版として、ブラウザ履歴・会議・メール・コードを常時グラフ化し続けるデスクトップアプリ「Penpax」も開発中だ。こちらは現在ウェイトリスト受付中となっている。
最新バージョンはv0.5.4(2026年4月28日リリース)で、SSRFのDNSリバインディング攻撃への対策が加わっている。