AWSが独自スイッチとホローコアファイバーで変えるネットワーク設計

ネットワークは壊れたときしか注目されない。AWSはそれを「あるべき姿」として15年かけて設計してきた。

2026年4月、The Registerはカリフォルニア州クパチーノにあるAWSのネットワーク開発ラボを取材した。そこで語られたのは、自社製スイッチ・OS・光ファイバーへの継続投資と、AI時代に対応する具体的な計画だ。

この記事でわかること：

AWSが独自スイッチと自社OS「NetOS」を作る理由
現行51.2 Tbps → 12ヶ月以内に102.4 Tbpsへのロードマップ
ホローコアファイバーで遅延が30%下がる仕組み
AIワークロード向け「UltraCluster」で通信ホップを7→5に削減する設計

https://www.theregister.com/2026/05/04/amazon_web_services_cupertino_networking_lab/

「壊れたときしか気にされない」がAWSの設計思想

AWSのグローバルネットワークエンジニアリング担当VP、Matt Rehder氏はラボのツアーでこう語った。「ネットワークは壊れたときしか気にされない。それ以外のときは邪魔にならないことが重要だ」

この哲学は2010年に始まる。当時のAmazon SVP、James Hamiltonが「データセンターのネットワークは邪魔だ（Datacenter Networks are in my Way）」と題した講演で、垂直統合型のネットワーク機器ベンダーへの依存を批判した。競争とオープンソースが当たり前のサーバー業界と対比させ、クラウドの成長には根本的に異なるアプローチが必要だと主張した。

それ以来、AWSは自社のスイッチ、ルーター、そしてOSの開発を続けてきた。

1種類のASICですべてのネットワークを賄う

通常、ネットワークプロバイダーは集約ネットワーク・コアネットワーク・ボーダーネットワークにそれぞれ異なるスイッチング用ASIC（特定用途向け集積回路）を使う。メモリ容量・性能・スループットの要件が異なるためだ。

AWSはそれを1種類のASICで統一している。

「1つのものに過剰投資して本当に高品質にすれば、信頼性が高まる。供給チェーンの管理やスケールアップを計画するとき、複数のSKUを調整する必要もない」とRehder氏は説明する。

ただし代償はある。用途別ASICが持つ機能の一部が使えなくなる。この制約を補うのが自社OS「NetOS」（Linuxベース）だ。スイッチ上のロジックをソフトウェアで担うことで、シリコンの限界を超える柔軟性を確保している。全デバイスが同一のOSを使うため、セキュリティスキャン・バグ修正・パッチ適用を一括で素早く行えるという副次効果もある。

現行51.2 Tbps、12ヶ月以内に102.4 Tbpsへ

現在のAWS製スイッチは、64ポート（各800 Gbps）で51.2 Tbpsのトラフィックを処理する。12ヶ月以内にリリース予定の次世代スイッチは、64ポートが各1.6 Tbpsで動作し、合計102.4 Tbpsを実現する。

現時点でAWSのネットワークは約200万台のデバイスと5,000〜6,000万本の光学トランシーバで構成されている。地上・海底を合わせると約2,000万kmのファイバーが敷設され、地球から月を25往復できる長さに相当する。データセンター内のケーブルを含めると、さらに1桁多い。

ホローコアファイバーが変えるデータセンター配置

AWSが最近展開を進めている技術のひとつが「ホローコアファイバー（hollow core fiber）」だ。

通常の光ファイバーでは、光信号がガラス繊維の中を伝わる。ホローコアファイバーは、ガラス管の中が空気または真空になっており、屈折による干渉が少ないため、光が自然に近い速度で伝わる。

結果として遅延を30%削減できる。

この数字がデータセンター配置に直結する。AWSがリージョンを構築するとき、複数のアベイラビリティゾーンは「同一リージョン内にいる」ようにアプリが振る舞える距離に置く必要がある。低遅延が前提だ。ホローコアファイバーを使うと、この距離制約が緩和され、データセンターをより広い範囲に分散できる。土地と電力の確保に選択肢が増えることを意味する。

Rehder氏によると、すでに一部の拠点で展開済みだ。コストは従来ファイバーより高いが、「データセンター・サーバー・ネットワーク全体のコストから見れば、ファイバーの費用は小さい」と述べた。

AIが加速させた帯域需要とUltraCluster

生成AIサービスの普及でネットワーク帯域の需要は急増している。Rehder氏によれば、AI向けアクセラレーターサーバーは従来のCPUベースサーバーの3〜4倍の帯域を必要とする。

この需要に対応するため、AWSは「UltraCluster」と呼ぶネットワークトポロジーを採用している。従来のネットワークでは2つのサーバー間に7台のネットワーク機器が介在していたが、UltraClusterでは5台に削減する。ホップ数が減ることで、より多くのサーバーをより低遅延で接続できる。

「同じハードウェアと同じソフトウェアを使いながら、異なるパッケージングで組み合わせている」とRehder氏は説明する。AI需要に応じてトポロジーを変えながら、ハードウェアの共通化は維持しているということだ。

接続品質を事前検証する「Firefly」コネクタ

光ファイバーはEthernetポートと異なり、接続が完全でないだけで信号が劣化する。汚れていても同様だ。大規模運用では、新しいエンドポイントを追加するたびにこの問題が起きうる。

AWSが使うのが「Firefly」と呼ぶコネクタだ。送信と受信をループさせてファイバーの信号パスを事前に検証する仕組みで、アーケードゲーム「スペースインベーダー」のキャラクターに外見が似ている。新しいエンドポイントをつなぐ前にファイバーパスがクリーンかどうかを確認でき、接続後のトラブルを未然に防ぐ。

「新しいクライアントをつなぐとき、ただ差し込めばいい状態にする」とRehder氏は述べた。信頼性を維持しながら高速に展開する仕組みの一端だ。

ネットワークを「見えなく」するための投資が続く

AWSが独自スイッチ・OS・光ファイバーに投資し続ける核心は、ネットワークをインフラの主役にしないためだ。電灯のスイッチのように、押せば動くのが当たり前の存在として扱う。

次世代スイッチ（102.4 Tbps）の投入とホローコアファイバーの展開拡大は、帯域需要が3〜4倍に増えるAI時代に向けた備えだ。独自設計の積み重ねが、AWS上で動くサービスの信頼性を下支えしている。