upp
p
p
ゆるっと読める技術メモ
#Anyscale
1 件の記事
25
6月 2026
テクノロジー
GKEのRay Serve LLMがスループット5倍・遅延8分の1
LLMの本番推論では、開発しやすさとスループットの両立が長年…