upp
p
p
ゆるっと読める技術メモ
#EAGLE
1 件の記事
12
5月 2026
テクノロジー
LLM推論を最大8倍速くする Speculative Decodingの仕組み
LLMの応答が1トークンずつしか出てこない——そのボトルネッ…