31Bパラメータのオープンモデルが、109Bのライバルを性能で超えた。

Googleは2026年4月2日、新世代のオープンモデルファミリー「Gemma 4」を公開しました。31B DenseモデルはArena AIのオープンモデルランキング世界3位を獲得し、Llama 4 Scout(総109B)をGPQA Diamondで10ポイント以上引き離しています。ライセンスもApache 2.0に変更され、商用利用の制限がなくなりました。

この記事でわかること:

  • Gemma 4の4つのモデルサイズとそれぞれの用途
  • 31B Denseのベンチマークスコアと競合モデルとの比較
  • OllamaやGoogle AI Studioでの導入方法
  • Apache 2.0ライセンスによる商用利用の条件

https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/

前世代から何が変わったか

Gemma 4の最大の変化はライセンスです。従来の「Gemmaライセンス」は商用利用に一定の制限がありましたが、Gemma 4ではApache 2.0に切り替わりました。改変・再配布・商用製品への組み込みが自由になり、著作権表示とライセンス文の同梱のみが条件です。

2点目は推論能力の強化です。数学コンテスト形式のベンチマーク「AIME 2026」では89.2%を達成しました。

3点目はマルチモーダルの全モデル標準化です。画像・映像・音声の入力が、エッジ向けのE2Bを含む全サイズで利用できます。また、140以上の言語でネイティブ学習されており、多言語アプリの開発に直接対応します。

31B Denseのベンチマーク

公式モデルカードに記載されている主要スコアは以下のとおりです(参考)。

  • MMLU Pro(幅広い知識評価): 85.2%
  • AIME 2026(数学推論): 89.2%
  • LiveCodeBench v6(コード生成): 80.0%
  • GPQA Diamond(科学的推論): 84.3%
  • MMMU Pro vision(マルチモーダル理解): 76.9%

Arena AIのオープンモデルテキストランキングでは、31B Denseが3位、26B MoEが6位です。Llama 4 Scout(総パラメータ109B)のGPQA Diamondスコアが74.3%であるのに対し、Gemma 4 31B Denseは84.3%と10ポイント以上の差があります。パラメータ数で3倍以上小さいモデルが、ランキングで上回っています。

コーディング面でも、LiveCodeBench v6で80.0%(Llama 4 Scout: 77.1%)と上回っており、小規模ながら実用的な開発補助が可能な水準に達しています。

4つのモデルサイズの選び方

Gemma 4はユースケースと動作環境によって4サイズから選びます。

E2B・E4Bはエッジデバイス専用です。スマートフォン・Raspberry Pi・NVIDIA Jetson Orin Nanoなどでオフライン実行できます。E2Bは128Kコンテキストウィンドウを持ち、音声入力もサポートします。Android開発者向けには、Android AI Coreのデベロッパープレビューを通じてAndroid Studioで今すぐ試せます。

26B MoEは推論速度を優先する場面向けです。総パラメータは26Bですが、推論時に活性化するのは3.8Bのみで、トークン生成速度が速く低コストです。Arena AIでもオープンモデル6位と高い評価を受けています。

31B Denseは最高性能を求める開発者やファインチューニング目的に向いています。単一の80GB NVIDIA H100に無量子化(bfloat16)で収まります。256Kのコンテキストウィンドウを持ち、リポジトリ全体や長文ドキュメントを1プロンプトで処理できます。

導入方法

Ollamaを使う場合、以下の1コマンドで即日実行できます。

ollama run gemma4

量子化版ならコンシューマーGPUでも動作します。llama.cpp・vLLM・LM Studio・MLX(Apple Silicon)・Unslothなど主要ツールが公式サポート済みです。

APIを先に試したい場合は、Google AI Studioで31BおよびMoEを無料で利用できます。モデルの重みはHugging Face・Kaggle・Ollamaから入手できます。ファインチューニングはGoogle Colab・Vertex AIのほか、自分のGPU環境でも実施できます。

Gemmaverseと実用事例

Gemmaシリーズ全体の累計ダウンロード数は4億回を超え、コミュニティによる派生バリアント(Gemmaverse)は10万種以上に達しています。ライセンスがApache 2.0になったことで、今後さらに商用派生モデルが増える見通しです。

実用事例では、INSAIT研究所がブルガリア語特化モデル「BgGPT」を構築したほか、Yale大学との共同研究で癌療法候補の探索にGemmaを活用した例が公式に報告されています(参考)。

本番デプロイとハードウェア対応

本番環境へのデプロイはVertex AI・Cloud Run・GKEを通じて対応しています。NVIDIA(Jetson Orin NanoからBlackwell GPU)・AMD(ROCm)・Google TPU(Trillium・Ironwood)に最適化されており、規模に応じた選択が可能です。

オープンウェイトとして重みが完全公開されているため、クラウドを使わずオンプレミスへ完全デプロイすることも、Googleへの追加申請なしに実施できます。データを外部に送りたくない規制業種でも採用しやすい構成です。