upp
p
p
ゆるっと読める技術メモ
#FlashAttention
2 件の記事
06
5月 2026
AIモデル
SubQ 初のサブ二乗アーキテクチャで1200万トークンを実現
LLMにコンテキストを増やすほど、処理コストが指数的に膨らむ…
22
4月 2026
オープンソース
CUDA学習を実務に寄せる LeetCUDAの強み
LeetCUDAは、CUDAを「理論だけ」で終わらせず、実装…