upp
p
p
ゆるっと読める技術メモ
#MTP
1 件の記事
11
5月 2026
テクノロジー
llama.cppのMTP対応でQwen3.6の推論速度が2倍超に
ローカルLLMの推論速度がボトルネックになっていませんか。同…