AIエージェントの手抜きを防ぐ20のエンジニアリングスキル

AIコーディングエージェントは仕事が速い。しかし、その速さには落とし穴がある。テストを書かずに進める、仕様を確認せずに実装を始める、セキュリティレビューをスキップする――こうした「最短ルート思考」は、後になって大きなコストとして返ってくる。

addyosmani/agent-skills はこの問題を解決するOSSだ。GoogleのChrome DevRelエンジニアリングリードであるAddy Osmani氏が主導するプロジェクトで、AIコーディングエージェントにプロダクション品質のエンジニアリングワークフローを与える20のスキルをまとめたリポジトリだ。2026年2月の公開から約2ヶ月で22,000スターを超えており、Claude Code・Cursor・Gemini CLIなど主要なAIコーディングツールで動作する。

この記事でわかること：

agent-skills が解決する課題と設計思想
6フェーズにわたる20スキルの概要
Claude Code・Cursor・Gemini CLIへのインストール方法

GitHub - addyosmani/agent-skills: Production-grade engineering skills for AI coding agents.

Production-grade engineering skills for AI coding agents. - addyosmani/agent-skills

GitHub

AIエージェントが「手を抜く」理由

Claude CodeやCursorに実装を任せると、動くコードはすぐに出てくる。しかし、テストが抜けていたり、仕様を詰めないまま実装が進んでいたりということは日常的に起こる。

これはエージェントの欠陥ではなく、設計上の特性だ。エージェントは「今の会話で最も合理的な応答を出力する」ように最適化されている。長期的な保守性よりも短期的な完成を優先しやすい。

agent-skills はこの問題に、「スキル」という形で構造化されたワークフローを与えることで対処する。各スキルはMarkdownファイルで、何をすべきか・どう検証するか・どんな言い訳をしてはいけないかを明示的に定義している。エージェントはスキルをコンテキストに読み込んで動作するため、一貫したプロセスを踏むようになる。

たとえば test-driven-development スキルには、「テストは後で書く」という言い訳に対するカウンター引数が明示されている。エージェントがこの言い訳を使おうとしても、スキルの定義がそれを退ける。

6フェーズにわたる20のスキル

スキルは開発ライフサイクルの6フェーズに分類されている。

Define（要件定義）

仕様を定義するフェーズ。idea-refine では曖昧なアイデアを具体的な提案へと整理し、spec-driven-development ではコードを書く前にPRDを完成させる原則を適用する。

Plan（計画）

planning-and-task-breakdown が担当する。仕様を小さく検証可能なタスクへ分解し、依存関係を整理する。

Build（実装）

最も多くのスキルが集まるフェーズだ。incremental-implementation（薄い縦断スライスで実装）、test-driven-development（Red-Green-Refactor）、context-engineering（エージェントに適切な情報を渡すタイミングの管理）、source-driven-development（公式ドキュメントを根拠にフレームワーク選択）、frontend-ui-engineering（コンポーネント設計とWCAG 2.1準拠）、api-and-interface-design（契約ファーストのAPI設計）が含まれる。

Verify（検証）

browser-testing-with-devtools ではChrome DevTools MCPでライブデータを確認する。debugging-and-error-recovery では「再現→局所化→縮小→修正→ガード」の5ステップで体系的にデバッグする。

Review（レビュー）

code-review-and-quality、code-simplification、security-and-hardening（OWASP Top 10対応）、performance-optimization（Core Web Vitals基準）の4スキルが品質ゲートを担う。コードサイズの目安は約100行で、それを超える場合はPRを分割する指針が示されている。

Ship（リリース）

git-workflow-and-versioning（トランクベース開発）、ci-cd-and-automation（Shift Left原則）、deprecation-and-migration（コードを負債として扱う考え方）、documentation-and-adrs（アーキテクチャ決定記録）、shipping-and-launch（段階的ロールアウトとロールバック手順）が含まれる。

7つのスラッシュコマンド

スキルは単体で呼び出すこともできるが、7つのスラッシュコマンドを使うとより自然に使える。コマンドを実行すると、そのフェーズに対応するスキルが自動的に有効になる。

コマンド	フェーズ	原則
`/spec`	Define	実装前に仕様を書く
`/plan`	Plan	小さなアトミックタスクへ分解
`/build`	Build	一度に一つのスライス
`/test`	Verify	テストは証明
`/review`	Review	マージ前の品質ゲート
`/code-simplify`	Review	賢さより明快さ
`/ship`	Ship	速さは安全に通じる

3つのエージェントペルソナ

スキルとは別に、用途を絞った3つのエージェントペルソナも用意されている。code-reviewer（シニアスタッフエンジニア視点でコードレビュー）、test-engineer（テスト戦略とカバレッジ分析）、security-auditor（脆弱性検出とOWASP評価）だ。各ペルソナはMarkdownで書かれており、Claude CodeやCursorのシステムプロンプトとして読み込む。

インストール方法

Claude Codeの場合：

/plugin marketplace add addyosmani/agent-skills
/plugin install agent-skills@addy-agent-skills

Cursorの場合：

任意の SKILL.md を .cursor/rules/ にコピーするか、skills/ ディレクトリ全体を参照する。

Gemini CLIの場合：

gemini skills install https://github.com/addyosmani/agent-skills.git --path skills

スキルはプレーンなMarkdownで書かれているため、システムプロンプトや指示ファイルを受け入れるあらゆるエージェントで使える。GitHub Copilot、Windsurf、Kiro IDE、OpenCodeでも動作する。

設計の背景にあるGoogleの開発原則

各スキルにはGoogleのエンジニアリング文化から抽出した原則が埋め込まれている。Hyrum’s Law（全ての観測可能な振る舞いに依存者が現れる）、Beyoncé Rule（使われなくなったコードへのテストを壊したなら、それを削除せよ）、テストピラミッド（単体80/統合15/E2E5）、Chesterton’s Fence（理由を理解せずに変更するな）といった概念が、各スキルのステップとして直接組み込まれている。

最新バージョン0.5.0（2026年4月10日リリース）では新スキル source-driven-development が追加された。フレームワークに関する実装上の判断を公式ドキュメントに根拠づけるスキルで、スタック検出・引用フォーマット・情報源が競合する場合の対処法を含む。またGemini CLIやOpenCodeとの統合設定も強化されている。

まとめ

agent-skills は、AIコーディングエージェントが陥りがちな「動くが品質が低いコード」を防ぐための仕組みを提供する。20のスキルと7つのスラッシュコマンドが開発ライフサイクル全体をカバーし、Claude Code・Cursor・Gemini CLIといった主要ツールで使える。MITライセンスで公開されており、チームや個人プロジェクトに自由に組み込める。