設計書もソースコードもテストケースも、社員は1行も手で書いていない。NTTデータのITアーキテクトが、商用システムを半年間AIネイティブで開発した記録をZennに公開しました。成功と失敗の両面が率直に語られた、実務者向けのレポートです。

この記事でわかること:

  • 社員3名がコードを手書きせずにシステムを納品した開発体制
  • 73個のプロンプトファイルで構築したAIエージェント環境の設計思想
  • テスト工程で発生した問題とその原因
  • AIネイティブ開発が若手育成に与えた効果

社員3名・GitHub Copilotだけで商用システムを開発

https://zenn.dev/nttdata_tech/articles/8a010aff542625

NTTデータのエグゼクティブITアーキテクト・茂呂範氏が2026年4月に公開した記事です。2025年10月から2026年3月までの半年間、AWS上で動作する商用サブシステムをスクラッチで開発しました。

チームは社員3名。これまで顧客との仕様調整が中心で、開発経験は豊富ではないメンバーです。メンター役のシニア社員がサポートし、茂呂氏は管理・監督に徹しました。設計書、ソースコード、テストケースのすべてをGitHub Copilotが生成し、社員はレビューに専念する体制です。アーキテクチャには社内標準のTerasolunaを採用しています。

プロンプト73個と9,000行のエージェント環境

AIエージェントの精度を左右したのは、.githubディレクトリ内に構築した環境です。プロンプトファイルが73個、規約・開発ルール・ドキュメント体系・タスク定義を含めたファイルは合計133個。空行を除いて約9,000行に達しました。

設計で重視したのは、エージェントが必要なドキュメントをすぐに見つけられること、成果物間の整合性を保てること、外部サービスに頼らず情報へアクセスできることです。コンテキストウィンドウの制約も強く意識しています。ファイルを細かく分割し、参照範囲を最小限に抑えることで、コンテキストに余裕がある状態を維持しました。

茂呂氏は「毎日ブラッシュアップしている」と述べており、この環境は一度作って終わりではなく、開発と並行して継続的に改善されています。

バイブコーディングを禁止した理由

要件定義ではバイブコーディング(自然言語で自由に指示する方法)を使いましたが、設計工程以降は禁止にしています。プロンプトファイルに定義されたコマンドだけを叩いて成果物を生成する方式に切り替えました。

禁止の理由は属人化の防止です。直接プロンプトを入力すると、品質が個人のプロンプト能力に左右されます。コマンド化すればノウハウがファイルに蓄積され、チーム全体で共有できます。開発終了後に他チームへそのまま移転できる点も狙いでした。修正時もプロンプトファイルの更新か、レビュー指摘票の作成のいずれかしか許可していません。

利用モデルはClaude Sonnet系列が中心で、場面に応じてGPT系列やGemini系列を使い分けました。茂呂氏の所感では、Claude系列は設計・コード生成に向き、GPT系列はテスト、Gemini系列はレビューに適する傾向があるとのことです。

テスト工程で露呈した課題

設計と製造は順調でしたが、テスト工程で深刻な問題が発生しました。

単体テストではテスト観点が大幅に不足していました。従来の設計書体系が暗黙的にカバーしていた観点が、今回の新しいドキュメント体系への移行で抜け落ちたことが原因です。結合テストでも、AIが生成したテストケースはゴールへ一直線に操作するパターンばかりで、同じ操作を繰り返すといったユーザーの実際の行動を再現できていませんでした。すり抜けバグが大量に総合テストへ持ち越される結果になっています。

茂呂氏は「動くモックを作った時点で画面操作のテストを先に書くべきだった」と振り返っています。テストファーストの原則は、AIネイティブ開発でも有効です。

若手が変わった

今回あえて若手中心のチームを編成したのは、育成を意識した判断です。AIエージェントはINPUTからOUTPUTへのサイクルを高速に回します。結果が期待どおりでなければ、INPUTかプロンプトに問題があると気づけます。この改善ループを繰り返すことで、メンバーの技術的な目利き力が従来より速いペースで養われたと茂呂氏は述べています。

実際に変化は表れました。以前は疲れた顔で帰宅していたメンバーが、楽しそうに開発するようになったとのことです。自分たちでプロセスを設計し、プロンプトを改善し、AIの成果物を評価する経験が、開発者としての自信につながっています。

ハーネスエンジニアリングとの共鳴

茂呂氏がこの取り組みに強い確信を持ったきっかけは、OpenAIが2026年2月に発表したハーネスエンジニアリングの記事です(参考)。OpenAIの3名チームが約100万行のコードをエージェント生成だけで出荷した実験と、NTTデータの取り組みは規模こそ違えど、アプローチが似ています。人間がコードを書く代わりに、環境設計・意図の定義・フィードバックループの構築に集中する点は共通です。

茂呂氏の次の目標は、100万行規模のAIネイティブ開発です。テスト領域の課題改善を進めながら、次のステージへの準備が始まっています。