#Speculative Decoding

1 件の記事

12
5月 2026
テクノロジー

LLM推論を3倍速くするSpeculative Decodingの仕組み

LLMの応答が遅い。その原因のほとんどは、モデルの賢さではな…