#Kimi Linear

1 件の記事

22
4月 2026
テクノロジー

長文推論を軽くする Kimi LinearのKVキャッシュ削減戦略

長いコンテキストを扱うLLMでは、精度より先にメモリと速度が…