upp
p
p
ゆるっと読める技術メモ
#Speculative Decoding
1 件の記事
12
5月 2026
テクノロジー
LLM推論を3倍速くするSpeculative Decodingの仕組み
LLMの応答が遅い。その原因のほとんどは、モデルの賢さではな…