31Bパラメータのオープンモデルが、109Bのライバルを性能で超えた。
Googleは2026年4月2日、新世代のオープンモデルファミリー「Gemma 4」を公開しました。31B DenseモデルはArena AIのオープンモデルランキング世界3位を獲得し、Llama 4 Scout(総109B)をGPQA Diamondで10ポイント以上引き離しています。ライセンスもApache 2.0に変更され、商用利用の制限がなくなりました。
この記事でわかること:
- Gemma 4の4つのモデルサイズとそれぞれの用途
- 31B Denseのベンチマークスコアと競合モデルとの比較
- OllamaやGoogle AI Studioでの導入方法
- Apache 2.0ライセンスによる商用利用の条件
https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/
前世代から何が変わったか
Gemma 4の最大の変化はライセンスです。従来の「Gemmaライセンス」は商用利用に一定の制限がありましたが、Gemma 4ではApache 2.0に切り替わりました。改変・再配布・商用製品への組み込みが自由になり、著作権表示とライセンス文の同梱のみが条件です。
2点目は推論能力の強化です。数学コンテスト形式のベンチマーク「AIME 2026」では89.2%を達成しました。
3点目はマルチモーダルの全モデル標準化です。画像・映像・音声の入力が、エッジ向けのE2Bを含む全サイズで利用できます。また、140以上の言語でネイティブ学習されており、多言語アプリの開発に直接対応します。
31B Denseのベンチマーク
公式モデルカードに記載されている主要スコアは以下のとおりです(参考)。
- MMLU Pro(幅広い知識評価): 85.2%
- AIME 2026(数学推論): 89.2%
- LiveCodeBench v6(コード生成): 80.0%
- GPQA Diamond(科学的推論): 84.3%
- MMMU Pro vision(マルチモーダル理解): 76.9%
Arena AIのオープンモデルテキストランキングでは、31B Denseが3位、26B MoEが6位です。Llama 4 Scout(総パラメータ109B)のGPQA Diamondスコアが74.3%であるのに対し、Gemma 4 31B Denseは84.3%と10ポイント以上の差があります。パラメータ数で3倍以上小さいモデルが、ランキングで上回っています。
コーディング面でも、LiveCodeBench v6で80.0%(Llama 4 Scout: 77.1%)と上回っており、小規模ながら実用的な開発補助が可能な水準に達しています。
4つのモデルサイズの選び方
Gemma 4はユースケースと動作環境によって4サイズから選びます。
E2B・E4Bはエッジデバイス専用です。スマートフォン・Raspberry Pi・NVIDIA Jetson Orin Nanoなどでオフライン実行できます。E2Bは128Kコンテキストウィンドウを持ち、音声入力もサポートします。Android開発者向けには、Android AI Coreのデベロッパープレビューを通じてAndroid Studioで今すぐ試せます。
26B MoEは推論速度を優先する場面向けです。総パラメータは26Bですが、推論時に活性化するのは3.8Bのみで、トークン生成速度が速く低コストです。Arena AIでもオープンモデル6位と高い評価を受けています。
31B Denseは最高性能を求める開発者やファインチューニング目的に向いています。単一の80GB NVIDIA H100に無量子化(bfloat16)で収まります。256Kのコンテキストウィンドウを持ち、リポジトリ全体や長文ドキュメントを1プロンプトで処理できます。
導入方法
Ollamaを使う場合、以下の1コマンドで即日実行できます。
ollama run gemma4
量子化版ならコンシューマーGPUでも動作します。llama.cpp・vLLM・LM Studio・MLX(Apple Silicon)・Unslothなど主要ツールが公式サポート済みです。
APIを先に試したい場合は、Google AI Studioで31BおよびMoEを無料で利用できます。モデルの重みはHugging Face・Kaggle・Ollamaから入手できます。ファインチューニングはGoogle Colab・Vertex AIのほか、自分のGPU環境でも実施できます。
Gemmaverseと実用事例
Gemmaシリーズ全体の累計ダウンロード数は4億回を超え、コミュニティによる派生バリアント(Gemmaverse)は10万種以上に達しています。ライセンスがApache 2.0になったことで、今後さらに商用派生モデルが増える見通しです。
実用事例では、INSAIT研究所がブルガリア語特化モデル「BgGPT」を構築したほか、Yale大学との共同研究で癌療法候補の探索にGemmaを活用した例が公式に報告されています(参考)。
本番デプロイとハードウェア対応
本番環境へのデプロイはVertex AI・Cloud Run・GKEを通じて対応しています。NVIDIA(Jetson Orin NanoからBlackwell GPU)・AMD(ROCm)・Google TPU(Trillium・Ironwood)に最適化されており、規模に応じた選択が可能です。
オープンウェイトとして重みが完全公開されているため、クラウドを使わずオンプレミスへ完全デプロイすることも、Googleへの追加申請なしに実施できます。データを外部に送りたくない規制業種でも採用しやすい構成です。