AIエージェントが31時間動き続け、$62.50でソフトウェアのSDKを書き直した。

この記事では、自律開発プロジェクトAURAの実例をもとに以下の内容を解説します。

  • GPT-5.5が長時間の開発タスクを継続できる仕組み
  • $62.50という開発コストが示す現実
  • Rustと量子耐性暗号の組み合わせが選ばれた理由
  • 現時点での自律開発の課題と評価の難しさ

31時間・$62.50の開発プロジェクトで何が起きたか

https://x.com/real_n3o/status/2048183516912091153

2026年4月25日、セキュアなソフトウェアの自律構築を目指すプロジェクトAURAが、GPT-5.5を使った31時間連続の開発を実施した。内容はZERO SDKの全面再構築で、量子耐性暗号をRust言語で実装するというものだ。APIコストの総額は$62.50(約9,500円)だった。

「セキュアなソフトウェアが自律的に自分自身を構築する」というのがAURAの最終目標で、今回はその実証ステップに位置づけられている。

31時間は、人間のエンジニアが通常業務として取り組めば約4日分の作業時間に相当する。それが計算コスト$62.50で回った事実は、AIエージェントが単純なコード補完を超えた実務開発に踏み込んでいることを示している。

GPT-5.5がエージェントタスクに向いている理由

GPT-5.5は2026年4月23日にOpenAIがリリースしたモデルで、エージェント向けの利用を明確に想定した設計になっている。OpenAIのグレッグ・ブロックマン共同創業者は「より自律的で直感的なコンピューティングに向けた大きな前進」と述べ、「より少ないトークンで、より速く、より鋭い思考ができる」と説明している。

フロンティアモデルが長時間タスクに対応できるようになった背景には、ツール呼び出し・結果の解釈・修正の繰り返しという一連の工程を中断なく継続できるようになった変化がある。ファイルを読んでコードを書き、エラーを解釈して修正するサイクルを、人間が介入せずに何十回も回せる。Anthropicが2026年4月に発表した「2026 Agentic Coding Trends Report」でも、AIエージェントが「数分から数時間」にわたるタスクを実行できるようになったことが、開発現場で構造的な変化を起こしていると指摘している(参考)。

$62.50というコストをどう読むか

$62.50という数字を単純に「安い」と結論づけるのは正確ではない。重要なのはコストの絶対値より、31時間の連続稼働でひとつのSDKを完成させたという事実だ。

人間のエンジニアが同じ作業をした場合、時給3,000円として31時間分で約93,000円になる。APIコストと比較すれば10倍以上の差になるが、品質の検証や責任の所在は別の問題だ。

Anthropicのレポートでは、開発者がAIを業務の約60%で活用しているにもかかわらず、「完全に委任できる」と感じるタスクは0〜20%にとどまると報告されている。$62.50はAPIの計算費用であり、設定の準備・出力の検証・テストの実行といった人間側の作業コストは含まれていない。

なぜRustで量子耐性暗号を実装したのか

Rustと量子耐性暗号の組み合わせには、セキュリティ上の明確な意図がある。

量子耐性暗号(Post-Quantum Cryptography)とは、将来の量子コンピュータによる解読に対して耐性を持つ暗号方式だ。米国立標準技術研究所(NIST)は2024年にML-KEM(旧称Kyber)とML-DSAを標準アルゴリズムとして正式採択しており、セキュリティ要件の高いシステムでは今後不可欠の要素になりつつある。

RustはCやC++と同等の実行速度を持ちながら、バッファオーバーフローやuse-after-freeといったメモリ系のバグをコンパイル時に排除できる言語だ。暗号実装のような「誤りが致命的になる」分野に適している。AIエージェントがこの技術選択を踏まえて実装を進めたとすれば、単なるコード生成を超えた設計判断を含む開発ができていることになる。

自律開発の現在地と課題

AURAが「非常に近づいている」という表現を使っているのは、まだ完全には到達していないことを意味している。今回の31時間プロジェクトも、完全無人ではなく設定や検証の部分で人間の関与があったと考えるのが自然だ。

現時点でのAIエージェントの主な課題として、長時間タスクでの一貫性がある。前のステップの判断と矛盾する出力が出たり、同じ誤りを繰り返したりするケースが報告されている。生成されたコードが実際に動作するかの検証も、依然として人間の作業が必要だ。

GPT-5.5のようなエージェント向けモデルが整備されるにつれ、AIに委任できるタスクの範囲は拡大している。セキュリティ要件の高い暗号実装を含むSDKの再構築を31時間で進められる段階になっているという事実は、自律開発が実証実験の枠を超えつつあることを示す具体例だ。