#Anyscale

1 件の記事

25
6月 2026
テクノロジー

GKEのRay Serve LLMがスループット5倍・遅延8分の1

LLMの本番推論では、開発しやすさとスループットの両立が長年…