2026年4月はLLMのリリースラッシュでした。Google・Alibaba・DeepSeekなど各社が相次いで新モデルを投入し、オープンソース領域でのベンチマーク競争が一段と激化しています。
この記事でわかること:
- 2026年4月にリリースされた注目LLM5モデルの概要
- 各モデルのパラメータ・コンテキスト長・ライセンスの要点
- エージェント向けコーディング性能の最新動向
Gemma 4(Google、4月2日)
GoogleがGemini 3と同一の研究基盤から開発したオープンモデルです。Apache 2.0ライセンスで商用利用が可能です。
E2B・E4B・26B A4B・31Bの4サイズで展開しており、DenseとMixture-of-Experts(MoE)の両アーキテクチャを採用しています。コンテキスト長は小型モデルが128K、中型モデルが256Kです。
性能の向上幅が際立っています。AIME 2026のスコアはGemma 3の20.8%から89.2%へ急伸し、Codeforces ELOは110から2150へと跳ね上がりました。公開モデルにおける単一世代での伸び幅としては最大級です。ネイティブ関数呼び出しとシステムロールに対応しており、エージェント構築での利用が広がっています。思考モード(Thinking mode)も全サイズで設定可能です。
GLM-5.1(Z.ai、4月7日)
中国のZ.ai(旧Zhipu AI)が4月7日に公開したGLM-5のポストトレーニング強化版です。総パラメータ7440億のMoE構造で、推論時のアクティブパラメータは400億です。コンテキスト長は200Kで、最大出力長は131Kトークンです。
コーディング評価指標のSWE-Bench ProでGLM-5.1はスコア58.4を記録し、GPT-5.4の57.7・Claude Opus 4.6の57.3を上回って首位に立ちました。特徴的なのは長時間エージェント実行への特化です。単一のコーディングタスクを最長8時間継続して処理でき、行き詰まった際には自らの戦略を根本から見直してアプローチを切り替える設計になっています。KernelBench Level 3では実際の機械学習ワークロードで3.6倍の高速化を達成しています(参考)。ライセンスはMIT、APIは入力100万トークンあたり1ドル・出力3.2ドルです。
Qwen3.6(Alibaba、4月2〜22日)
Alibabaが4月中に段階的にリリースしたシリーズです。Qwen3.6-Plus(4月2日)は1Mトークンのコンテキスト長をデフォルトで提供し、エンタープライズ向けの安定性を重視しています。4月16日公開のQwen3.6-35B-A3Bは総パラメータ350億でアクティブ30億のスパースMoE構成です。4月22日にはエージェント向けコーディングに特化した密なモデルQwen3.6-27Bが加わりました。Qwen3.6-27Bは3970億パラメータ規模のMoEモデルを各種エージェントコーディング指標で上回るとされています(参考)。オープンウェイトはApache 2.0ライセンスです。
ファミリー共通の新機能として「Thinking Preservation」があります。マルチターン会話を通じて推論トレースを引き継ぐことで不要なトークン生成を削減し、エージェントタスクでのKVキャッシュ効率を高めます。
Kimi K2.6(Moonshot AI、4月20日)
中国のMoonshot AIが4月20日に公開したMoEモデルです。総パラメータ1兆、推論時のアクティブパラメータは320億です。最大262,144トークンのコンテキスト長に対応し、テキスト・画像・動画を一つのアーキテクチャで処理するマルチモーダル設計を採用しています。
SWE-Bench Proのスコアは58.6で、今回紹介する5モデルの中で最高値です。エージェントのスウォーム(群)実行に対応しており、複雑なタスクに対して最大300のサブエージェントを並列起動し、4,000ステップ以上にわたる協調処理を実現します。Cloudflare Workers AIでも利用可能になっており、エッジ環境への展開も視野に入れた設計です。
DeepSeek V4(DeepSeek、4月24日)
DeepSeekが4月24日にプレビュー公開したオープンソースモデルです。2つのバリアントがあります。V4-Proは総パラメータ1.6兆・アクティブ490億で、クローズドモデルに匹敵する性能を目指した旗艦バリアントです。V4-Flashは総パラメータ2840億・アクティブ130億で、速度と低コストを優先した選択肢です。
両バリアントとも100万トークンのコンテキスト長を標準でサポートします。独自の注意機構「DSA(DeepSeek Sparse Attention)」とトークン単位の圧縮技術により、長文脈処理時の演算量とメモリ消費を大幅に削減しています。Claude Code・OpenCode・OpenClawなど主要エージェントツールとの統合が組み込まれており、コーディングエージェント用途を正面から狙った設計です。APIはOpenAI互換・Anthropic互換のどちらのインターフェースにも対応しています。
4月のリリース群が指し示すトレンド
5モデルに共通する設計思想として「長時間エージェント実行」への傾倒が挙げられます。GLM-5.1の8時間継続コーディングやKimi K2.6の300エージェント並列実行は、単発の応答から継続的な自律処理への転換を如実に表しています。コンテキスト長の面では、DeepSeek V4が100万トークンをデフォルトにしたことが象徴的で、長文書処理や長期記憶を要するタスクへの適用が現実的な選択肢になっています。SWE-Bench Proの上位をZ.ai・Moonshot AIの中国モデルが占める状況は、オープンソース領域での競争が地理的に広がっていることを示しています。
