upp
p
p
ゆるっと読める技術メモ
#Modal
2 件の記事
26
6月 2026
テクノロジー
DFlashで122B推論が1000tok/s超 品質劣化なし
推論のボトルネックは、計算よりも重みの読み込みにあります。 …
25
6月 2026
アプリ・サービス
Modalの管理型LLMエンドポイントが全ユーザーに公開
自社アプリにLLMを組み込むとき、推論基盤を自前で組むか、A…