ネットワークは壊れたときしか注目されない。AWSはそれを「あるべき姿」として15年かけて設計してきた。
2026年4月、The Registerはカリフォルニア州クパチーノにあるAWSのネットワーク開発ラボを取材した。そこで語られたのは、自社製スイッチ・OS・光ファイバーへの継続投資と、AI時代に対応する具体的な計画だ。
この記事でわかること:
- AWSが独自スイッチと自社OS「NetOS」を作る理由
- 現行51.2 Tbps → 12ヶ月以内に102.4 Tbpsへのロードマップ
- ホローコアファイバーで遅延が30%下がる仕組み
- AIワークロード向け「UltraCluster」で通信ホップを7→5に削減する設計
https://www.theregister.com/2026/05/04/amazon_web_services_cupertino_networking_lab/
「壊れたときしか気にされない」がAWSの設計思想
AWSのグローバルネットワークエンジニアリング担当VP、Matt Rehder氏はラボのツアーでこう語った。「ネットワークは壊れたときしか気にされない。それ以外のときは邪魔にならないことが重要だ」
この哲学は2010年に始まる。当時のAmazon SVP、James Hamiltonが「データセンターのネットワークは邪魔だ(Datacenter Networks are in my Way)」と題した講演で、垂直統合型のネットワーク機器ベンダーへの依存を批判した。競争とオープンソースが当たり前のサーバー業界と対比させ、クラウドの成長には根本的に異なるアプローチが必要だと主張した。
それ以来、AWSは自社のスイッチ、ルーター、そしてOSの開発を続けてきた。
1種類のASICですべてのネットワークを賄う
通常、ネットワークプロバイダーは集約ネットワーク・コアネットワーク・ボーダーネットワークにそれぞれ異なるスイッチング用ASIC(特定用途向け集積回路)を使う。メモリ容量・性能・スループットの要件が異なるためだ。
AWSはそれを1種類のASICで統一している。
「1つのものに過剰投資して本当に高品質にすれば、信頼性が高まる。供給チェーンの管理やスケールアップを計画するとき、複数のSKUを調整する必要もない」とRehder氏は説明する。
ただし代償はある。用途別ASICが持つ機能の一部が使えなくなる。この制約を補うのが自社OS「NetOS」(Linuxベース)だ。スイッチ上のロジックをソフトウェアで担うことで、シリコンの限界を超える柔軟性を確保している。全デバイスが同一のOSを使うため、セキュリティスキャン・バグ修正・パッチ適用を一括で素早く行えるという副次効果もある。
現行51.2 Tbps、12ヶ月以内に102.4 Tbpsへ
現在のAWS製スイッチは、64ポート(各800 Gbps)で51.2 Tbpsのトラフィックを処理する。12ヶ月以内にリリース予定の次世代スイッチは、64ポートが各1.6 Tbpsで動作し、合計102.4 Tbpsを実現する。
現時点でAWSのネットワークは約200万台のデバイスと5,000〜6,000万本の光学トランシーバで構成されている。地上・海底を合わせると約2,000万kmのファイバーが敷設され、地球から月を25往復できる長さに相当する。データセンター内のケーブルを含めると、さらに1桁多い。
ホローコアファイバーが変えるデータセンター配置
AWSが最近展開を進めている技術のひとつが「ホローコアファイバー(hollow core fiber)」だ。
通常の光ファイバーでは、光信号がガラス繊維の中を伝わる。ホローコアファイバーは、ガラス管の中が空気または真空になっており、屈折による干渉が少ないため、光が自然に近い速度で伝わる。
結果として遅延を30%削減できる。
この数字がデータセンター配置に直結する。AWSがリージョンを構築するとき、複数のアベイラビリティゾーンは「同一リージョン内にいる」ようにアプリが振る舞える距離に置く必要がある。低遅延が前提だ。ホローコアファイバーを使うと、この距離制約が緩和され、データセンターをより広い範囲に分散できる。土地と電力の確保に選択肢が増えることを意味する。
Rehder氏によると、すでに一部の拠点で展開済みだ。コストは従来ファイバーより高いが、「データセンター・サーバー・ネットワーク全体のコストから見れば、ファイバーの費用は小さい」と述べた。
AIが加速させた帯域需要とUltraCluster
生成AIサービスの普及でネットワーク帯域の需要は急増している。Rehder氏によれば、AI向けアクセラレーターサーバーは従来のCPUベースサーバーの3〜4倍の帯域を必要とする。
この需要に対応するため、AWSは「UltraCluster」と呼ぶネットワークトポロジーを採用している。従来のネットワークでは2つのサーバー間に7台のネットワーク機器が介在していたが、UltraClusterでは5台に削減する。ホップ数が減ることで、より多くのサーバーをより低遅延で接続できる。
「同じハードウェアと同じソフトウェアを使いながら、異なるパッケージングで組み合わせている」とRehder氏は説明する。AI需要に応じてトポロジーを変えながら、ハードウェアの共通化は維持しているということだ。
接続品質を事前検証する「Firefly」コネクタ
光ファイバーはEthernetポートと異なり、接続が完全でないだけで信号が劣化する。汚れていても同様だ。大規模運用では、新しいエンドポイントを追加するたびにこの問題が起きうる。
AWSが使うのが「Firefly」と呼ぶコネクタだ。送信と受信をループさせてファイバーの信号パスを事前に検証する仕組みで、アーケードゲーム「スペースインベーダー」のキャラクターに外見が似ている。新しいエンドポイントをつなぐ前にファイバーパスがクリーンかどうかを確認でき、接続後のトラブルを未然に防ぐ。
「新しいクライアントをつなぐとき、ただ差し込めばいい状態にする」とRehder氏は述べた。信頼性を維持しながら高速に展開する仕組みの一端だ。
ネットワークを「見えなく」するための投資が続く
AWSが独自スイッチ・OS・光ファイバーに投資し続ける核心は、ネットワークをインフラの主役にしないためだ。電灯のスイッチのように、押せば動くのが当たり前の存在として扱う。
次世代スイッチ(102.4 Tbps)の投入とホローコアファイバーの展開拡大は、帯域需要が3〜4倍に増えるAI時代に向けた備えだ。独自設計の積み重ねが、AWS上で動くサービスの信頼性を下支えしている。