15年分のコードを捨てたら、性能が2倍になった。Cloudflareが2026年3月に発表したGen 13サーバーは、ハードウェアの世代交代だけでなく、ソフトウェアの全面書き換えによって成り立っています。

この記事でわかること

  • Gen 13サーバーのハードウェア構成と前世代からの変化
  • 旧ソフトウェアFL1がGen 13で性能を出せなかった原因
  • Rust製FL2への書き換えで何が変わったか
  • スループット2倍・電力効率50%向上の具体的な数値

https://blog.cloudflare.com/gen13-launch/

Gen 12からGen 13へ何が変わったか

Gen 13のCPUはAMD EPYC第5世代Turin 9965です。コア数は前世代Gen 12の96コアから192コアへ倍増しました。メモリはDDR5-6400を768GB搭載し、ストレージは24TBのPCIe 5.0 NVMe、ネットワークはデュアル100GbEという構成です。

ただし、コア数の増加と引き換えにL3キャッシュが大幅に減りました。Gen 12のGenoa-Xプロセッサは3D V-Cacheにより1コアあたり12MBのL3キャッシュを持っていました。Gen 13のTurin 9965では1コアあたり2MBしかありません。6分の1への削減です。

キャッシュ削減がもたらした問題

Cloudflareの旧リクエスト処理層「FL1」は、NGINXとLuaJITで構築された15年来のソフトウェアです。FL1はL3キャッシュに強く依存する設計でした。

Gen 13でFL1を動かしたところ、スループットは62%向上した一方で、高負荷時のレイテンシが50%以上悪化しました。L3キャッシュのヒット完了は約50サイクルですが、キャッシュミスでDRAMへアクセスすると350サイクル以上かかります。キャッシュが6分の1に減った結果、メモリアクセスの遅延がリクエスト処理時間を圧迫したのです。

AMDとの共同チューニングも試みています。ハードウェアプリフェッチャーの調整、ワーカー数の増加、CPUピンニング、PQOS(Platform Quality of Service)による専用CCD割り当てなど複数の手法を検証しましたが、得られた改善は限定的でした。

FL2への全面書き換えで解決

根本的な解決策は、ソフトウェアの全面書き換えでした。Cloudflareは2025年のBirthday Weekで発表していたFL2プロジェクトをGen 13と組み合わせることで、キャッシュ依存の問題を解消しています。

FL2はRust製のリクエスト処理層で、PingoraとOxyというCloudflare自社フレームワークの上に構築されています。NGINXとLuaJITによる15年分のコードを置き換えたものです。メモリアクセスパターンの最適化と動的メモリ割り当ての削減により、大容量L3キャッシュへの依存を排除しました。

FL2の設計思想は、キャッシュ容量ではなくコア数に比例して性能がスケールする構造です。FL2はもともとGen 13のキャッシュ問題を解くために始まったプロジェクトではなく、Rustのメモリ安全性や開発速度の向上を目的としていました。結果的にそのアーキテクチャがGen 13のハードウェア特性と合致した形です。

実測値で見るGen 13 + FL2の性能

FL2をGen 13で動かした結果は明確です。

FL1と比較して、CPUあたりのリクエスト処理数は50%向上しました。Gen 12と比べたレイテンシは70%低下しています。Gen 12比のスループットは、FL1での62%増からFL2では100%増(2倍)に拡大しました。

ラック単位では、電力予算を変えずにスループットが60%向上しています。消費電力あたりの性能(perf/watt)はGen 12比で50%改善です。

この結果について、InfoQの報道ではHacker Newsでの議論も紹介されています。改善がハードウェアとソフトウェアのどちらに起因するのか、Rustの言語機能がキャッシュ効率にどう寄与したのかといった点に関心が集まりました(参考)。

ハードウェアとソフトウェアの協調設計

Gen 13の事例が示すのは、ハードウェアの進化だけでは性能向上を実現できないという現実です。CPUのコア数を2倍にしても、ソフトウェアがそのアーキテクチャに最適化されていなければ、レイテンシの悪化という代償を払うことになります。

CloudflareはFL2への移行を通じて、キャッシュ依存を排除し、コア数に比例したスケーリングを実現しました。Gen 13サーバーはすでに量産出荷が始まっており、グローバルのエッジネットワークへの展開が進んでいます。ハードウェア更新とソフトウェア刷新を同時に進めたことで、2倍のスループットと50%の電力効率改善を両立した点は、大規模インフラ運用における協調設計の好例です。