「オープンソースなら何にでも使える」「無料ならコストゼロ」——開発者の多くが無料LLMをこう誤解しています。実際には、ライセンス条件・ハードウェア費用・APIのデータ利用ポリシーが、モデル選定の成否を左右します。
この記事では、AIモデル分析者NeilXbt氏が30モデルを整理した比較資料を軸に、無料LLMを選ぶときに見落としがちなポイントを解説します。
- ホスト型とセルフホスト型で「無料」の意味がどう違うか
- Q4量子化時のVRAM目安とMoEモデルの罠
- Llama・Gemma・Command Rなど主要ライセンスの制限
- 厳密な定義で「完全オープンソース」と言えるモデルは何か
https://x.com/neil_xbt/status/2070056651952902408
「無料」の2つの顔
無料LLM一覧を見るとき、まず「誰が計算資源を持つか」で分類する必要があります。NeilXbt氏の整理では、大きく2種類に分かれます。
ホスト型の無料枠は、GroqやGoogle AI Studio、OpenRouterの無料モデルのように、提供者がGPUを動かし、利用者はAPIを叩くだけの形態です。料金はかかりませんが、レート制限や利用規約の変更リスクがあります。多くのホスト型サービスは、明示的にオプトアウトしない限りプロンプトを学習に使う設計です。機密データを扱うプロダクトでは、利用規約の「データ利用」条項を必ず確認してください。
セルフホスト型は、Ollamaやllama.cppで重みファイルを手元に置いて推論する方式です。モデル自体のダウンロードは無料ですが、GPU・電気代・運用工数は実費が発生します。「無料」と言えるのは重みの取得コストだけで、運用コストは別物です。
VRAMの目安とMoEの罠
セルフホストを検討するなら、VRAM(GPU上のメモリ)が最初のボトルネックになります。NeilXbt氏はQ4量子化時の経験則として、パラメータ10億あたり約0.6GBを目安に挙げています。8Bモデルなら8GBカード、70Bモデルなら24GBカード2枚が目安です。
ここで注意が必要なのがMoE(Mixture of Experts)アーキテクチャです。MoEは推論時に一部のエキスパートだけを動かすため、「アクティブパラメータ数」が小さく見えます。しかし推論エンジンは全エキスパートの重みをメモリに載せる必要があり、実際のVRAM消費は総パラメータ数に近づきます。NeilXbt氏の例では、アクティブ17Bと謳うモデルでも55GB程度を要するケースがあります(参考)。ベンチマークスコアだけで選ぶと、手元のGPUに収まらない事態になりかねません。
ライセンスで商用利用が止まる典型例
「オープンソース=商用利用OK」と短絡すると、プロダクト公開後にライセンス違反になるリスクがあります。主要モデルの制限を押さえておきましょう。
Llama(Meta)
LlamaはMeta Community Licenseのもと商用利用が可能ですが、条件が付きます。月間アクティブユーザー(MAU)が7億人を超えるプロダクトでは、Metaへの別途ライセンス申請が必要です。中小規模の開発では実質的な制約になりにくい一方、大規模サービスでは契約交渉が前提になります。加えて、再配布時の「Built with Llama」表記やAcceptable Use Policy(AUP)への準拠が義務付けられています(参考)。
Gemma(Google)
Gemmaは商用利用自体は認められていますが、利用規約の「Model Derivatives」条項が厳格です。Gemmaの重みや出力から得たパターンを使い、Gemmaと同様の性能を持つ別モデルを訓練することは制限対象です。蒸留や合成データによる競合モデル開発を計画しているチームは、Gemma Terms of Useの該当条項を読む必要があります(公式)。
Command R(Cohere)
CohereのCommand RはCC-BY-NCライセンスです。NCはNon-Commercial(非商用)の略で、有料プロダクトへの組み込みは認められません。Hugging Faceのモデルカードにも「CC-BY-NC」と明記されています(公式)。性能は高い一方、商用SaaSのバックエンドにはそのまま使えません。
制約の少ない選択肢
法的な質問を最小化したい場合は、Apache 2.0やMITライセンスのモデルが無難です。DeepSeek V3(MIT)やQwen 2.5(Apache 2.0)などは、利用者数の上限やAUPがなく、OSI(Open Source Initiative)が認めるオープンソースライセンスに該当します。
オープンソースとオープンウェイトの違い
「オープンソース」と「オープンウェイト(重み公開)」は別概念です。オープンウェイトは推論用の重みファイルを無料で入手できる状態を指しますが、学習データ・学習コード・中間チェックポイントの公開は伴いません。LlamaやGemma、Qwenの多くはこのカテゴリに入ります。
NeilXbt氏の比較では、20のモデルファミリーのうち、厳密な定義で「完全オープンソース」と言えるのはOlmoだけと整理されています。OlmoはAllen Institute for AI(Ai2)が開発し、学習データ・コード・中間チェックポイントまで含めた「モデルフロー全体」を公開しています(公式)。研究目的で学習過程を追跡したい場合や、コンプライアンス上OSI承認ライセンスが必須な組織では、Olmoが現実的な選択肢になります。
実務でのモデル選定チェックリスト
30モデル規模の一覧を使うときは、次の順で絞り込むと迷いにくくなります。
- 利用形態:APIで十分か、オフライン推論が必要か
- ライセンス:商用か、研究のみか、再配布の有無
- ハードウェア:手元のVRAMで収まるか(MoEは総パラメータで見積もる)
- データポリシー:ホスト型ならプロンプトの学習利用可否
性能ベンチマークは最後に見れば十分です。ライセンス違反やVRAM不足で選び直すコストのほうが、ベンチマーク数ポイントの差より大きくなることが多いからです。
比較資料の活かし方
NeilXbt氏の投稿は、コンテンツクリエイターexploraX氏の「30 Powerful LLMs You Can Run for Free in 2026」を補足する形で公開されています。元の一覧はホスト型とセルフホスト型を混在させた30モデルのカタログで、NeilXbt氏はそこにライセンス・VRAM・オープンソース定義の観点で「落とし穴」を重ねています。一覧をブックマークする前に、自分のプロジェクトがホスト型かセルフホスト型かを決め、該当カテゴリのモデルだけに絞るのが近道です。
無料LLMの選択は、「ダウンロード無料」か「API無料」かの一点から始まり、ライセンスとハードウェアの2段階で現実味を帯びます。この2段階を飛ばしてベンチマーク順位だけで決めると、リリース直前に詰むパターンが繰り返されています。選定の最初の30分をライセンス確認に使うだけで、後工程の手戻りは大きく減らせます。