#Modal

2 件の記事

26
6月 2026
テクノロジー

DFlashで122B推論が1000tok/s超 品質劣化なし

推論のボトルネックは、計算よりも重みの読み込みにあります。 …

25
6月 2026
アプリ・サービス

Modalの管理型LLMエンドポイントが全ユーザーに公開

自社アプリにLLMを組み込むとき、推論基盤を自前で組むか、A…