AIモデルの推論コストは、多くの企業にとって収益を圧迫する要因になっている。その根本原因はGPUの設計にあり、解決を目指す新しいアーキテクチャが登場してきた。

AnthropicがFractileという英国スタートアップとの接触を始めたと、The Informationが2026年5月に報じた。Fractileが開発するチップは、AIの推論を現行GPUの100倍速く、10分の1のコストで実行できるとうたう。この記事では、その技術の仕組みとAnthropicが関心を持つ背景を解説する。

この記事でわかること:

  • なぜGPUはAI推論の速度面で限界に近づいているか
  • FractileのSRAM融合アーキテクチャとは何か
  • AnthropicがFractileに注目する理由
  • 商用化の見通しと現時点での課題

GPUのAI推論に潜む「DRAMボトルネック」

GPUはもともと画像処理用に設計されたチップで、大量のデータを並列処理する能力がAIに適していた。しかし現代の大規模言語モデル(LLM)を動かすとき、GPUは一つの大きな障壁にぶつかる。

データの置き場所が遠すぎる問題だ。

現在のGPUは演算回路とは別の場所にあるDRAM(Dynamic Random Access Memory)チップにモデルの重みを保存している。推論を行うたびに、このDRAMとGPUの演算コアの間でデータを何度も転送しなければならない。この転送処理が速度上の「壁」になる——これをメモリウォールと呼ぶ。

LLMのパラメータ数が膨らむほど転送量は増え、処理速度の天井が下がっていく。さらにDRAMは消費電力も大きく、大規模データセンターではコストと発熱の両方を押し上げる。

FractileのMemory Compute Fusion Architecture

Fractileは2022年にオックスフォード大学ロボティクス研究所のWalter Goodwin博士が創業した英国スタートアップだ。社名は数学のフラクタルに由来する。

同社が提唱するのが「Memory Compute Fusion Architecture(メモリ・演算融合アーキテクチャ)」だ。DRAMへの依存を根本から断ち切り、演算に必要なデータを演算回路のすぐ隣に配置するSRAM(Static Random Access Memory)ベースの設計に切り替える。

SRAMはDRAMより高速でリフレッシュ動作も不要な半面、セル面積が大きく大容量化には不向きとされてきた。Fractileはここで独自の設計を持ち込み、メモリと演算処理を同一ダイ上に一体化することで、データ転送を最小化する構造を実現しようとしている。

GroqもSRAMをGPUに近づけるアプローチで知られるが、Goodwinは「Fractileはさらに一歩進めてメモリと演算を単一のコンポーネントに統合する」と説明する。NvidiaがGroqを200億ドルで買収した後にリリースしたGroq 3 LPXは500MBのSRAMと150 TB/sのSRAM帯域を持つが、Fractileはこのアプローチより高い性能目標を掲げる。

性能目標:100倍速・10分の1コスト・20倍省エネ

Fractileはシミュレーションに基づく目標値として以下を公表している。

  • LLM推論速度:NvidiaのGPUの100倍
  • コスト:GPUの10分の1
  • 電力効率:既存AIハードウェアの20倍

現時点でテストチップはまだ製造されておらず、これらはシミュレーション上の数値だ。ただし電力効率の目標は、データセンターの消費電力増大に悩む企業にとって単なるコスト削減以上の意味を持つ。

チームはNvidia、Graphcore、Imagination Technologiesなどの出身者で構成されており、ハードウェアと並行して独自ソフトウェアスタックも開発している。Nvidiaの強みがGPUだけでなく開発エコシステムのCUDAにあることを意識した設計方針だ。

AnthropicがFractileを必要とする理由

Anthropicは現在、NvidiaのGPU、GoogleのTPU、AmazonのTrainiumという3社のチップで推論インフラを支えている。特定ベンダーへの依存を避けるため、複数の供給元を維持する戦略を取る。

Fractileとの接触が報じられた背景には、推論コストが収益を圧迫しているという現実がある。Anthropicの年間換算収益は2026年3月に300億ドルに達したが、推論コストが利益率の引き下げ要因になっていると指摘されている。AnthropicはOpenAIやxAIのように自社データセンターを大規模展開する路線をとらず、複数ベンダーからの調達で調整力を確保する方針だ。

Fractileとの取引が実現すれば、従来の3社に続く第4の供給元となる。AnthropicはすでにBroadcomとの多ギガワット契約やAMDとの協議も進めており、チップ調達の多様化を着実に進めている。

商用化の見通しと現時点の課題

Fractileのチップが商業的に利用可能になるのは、早くても2027年頃とみられている。同社は2026年2月に英ブリストルに1億ポンドを投資した拠点を開設しており、テストチップの製造に向けた動きが加速している。資金調達では1億5千万ドルのシードラウンドに続き、200億ドル超の評価額で2億ドルの調達交渉中と報じられており、Founders Fund、8VC、Accelが投資候補として挙がっている。

最大の課題はシミュレーションから実チップへの移行だ。AI専用チップのスタートアップが設計段階の性能を実製品で再現できずに失速した事例は少なくない。特定用途に特化した設計は、モデルアーキテクチャの急速な変化についていけなくなるリスクも抱える。Fractileはこの課題を認識した上で、AIモデルの今後5〜10年の進化を見据えた設計を訴えているが、その実証はこれからだ。

DRAMへの依存を断ち切るというアプローチ自体は、AI推論の根本課題を正面から捉えたものだ。Anthropicが「早期交渉」という形で接近していることは、技術の方向性への一定の評価を示している。2027年の商用化に向けて、Fractileがどこまで数値目標を実チップで証明できるかが注目点になる。