#FlashAttention

2 件の記事

06
5月 2026
AIモデル

SubQ 初のサブ二乗アーキテクチャで1200万トークンを実現

LLMにコンテキストを増やすほど、処理コストが指数的に膨らむ…

22
4月 2026
オープンソース

CUDA学習を実務に寄せる LeetCUDAの強み

LeetCUDAは、CUDAを「理論だけ」で終わらせず、実装…