中国AIスタートアップDeepSeekが、2026年4月24日に新しいオープンソースLLMシリーズ「V4」を公開しました。GPT-5.5やClaude Opus 4.7に迫る性能を持ちながら、APIコストは7分の1以下という価格設定が注目を集めています。
この記事でわかること:
- V4の2モデル(ProとFlash)の仕様と使い分け
- KVキャッシュを90%削減した新アーキテクチャの概要
- GPT-5.5・Claude Opus 4.7との価格・ベンチマーク比較
- HuaweiチップへのネイティブサポートとMITライセンスによる商用利用
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro
V3.2からV4で何が変わったか
DeepSeek V4は、前世代のV3.2系から性能・アーキテクチャともに大幅に刷新されたシリーズです。
V4-Pro-Baseのベンチマークを見ると、MMLU(5-shot)が87.8から90.1に向上し、SuperGPQAは45.0から53.9に改善しています。特に目立つのはFACTS Parametricで、27.1から62.6と2倍以上に伸びています。コーディング能力を測るHumanEval(Pass@1)も62.8から76.8へ上昇しました。
長文処理能力を測るLongBench-V2は40.2から51.5に向上しており、V4が100万トークンのコンテキストウィンドウを活かせるよう最適化されていることがわかります。
DeepSeek AI研究者のDeli Chen氏はリリースにあたり「V3公開から484日、AGIは誰のものでもある」とコメントしています。
V4-ProとV4-Flash:2つのモデルの違い
V4シリーズは用途に合わせた2つのモデルで構成されます。
V4-Proはフラッグシップモデルで、1.6兆パラメータのMoE(Mixture of Experts)アーキテクチャを採用しています。推論時に実際に起動するパラメータは490億で、全体のごく一部です。エージェントコーディング・STEM・競技プログラミングでの高性能を訴求しており、Claude CodeやOpenClawなどのエージェントフレームワークへの対応を明示しています。
V4-Flashはより軽量なモデルで、2840億パラメータ(推論時起動は130億)で動作します。Proより速く・低コストで動作し、世界知識や複雑なエージェントタスクではProに劣るものの、長文脈シナリオでは上位世代のV3.2-Baseを上回るスコアを記録しています。
両モデルとも100万トークンのコンテキストウィンドウに対応しています。
3つの主要技術改善
V4の性能とコスト削減を支えているのは、主に3つの技術革新です。
ハイブリッドアテンションアーキテクチャは、KVキャッシュのメモリを前世代比90%削減します。LLMはプロンプトを処理する際にKVキャッシュと呼ばれる数値表現を使いますが、V4ではCSA(Compressed Sparse Attention)とHCA(Heavily Compressed Attention)の2種の圧縮手法を組み合わせることで、100万トークンのコンテキストを現実的なメモリ量で扱えるようにしています。単一トークン推論のFLOPsも前世代から73%削減されています。
mHC(Manifold-Constrained Hyper-Connections)は、1.6兆パラメータという巨大ネットワークの学習安定性を確保する仕組みです。LLMは層をまたいで情報を伝播させますが、従来の方法では深い層に情報が届きにくくなります。mHCは遠い層間の直接経路を確保し、学習誤差を減らして出力精度を高めます。
Muon optimizerは隠れ層の最適化を担うモジュールで、学習の収束を速め、学習に必要なインフラリソースを削減します。
また、V4では推論の深さを3段階で選べる「思考モード」が追加されています。通常のタスクに使うNon-think、複雑な問題に適したThink High、最大性能を引き出すThink Maxです。タスクの難易度に合わせてコンピュートを調整できるため、コスト効率がさらに高まります。
HuaweiチップへのネイティブサポートとMITライセンス
V4の特徴的な点のひとつが、HuaweiのAscend AIチップへの最適化です。DeepSeekのこれまでのV3・R1系モデルはNvidia GPUで学習されていましたが、V4ではHuawei Ascend 950ベースのスーパーノードクラスタへの対応が明記されており、V4-Flashの学習の一部にHuaweiのチップが使われています。
Huaweiはリリース直後、「Ascend 950ベースの製品ライン全体がDeepSeek-V4をサポートする」と発表しました。分析会社Omdiaのチーフアナリスト、Lian Jye Su氏はこの連携について「DeepSeekモデルがHuaweiとNvidiaの両ハードウェアで同等の性能を出せることを示し、中国の開発者が国内ソリューションだけでAIアプリを構築するための障壁を下げる」と評価しています(参考)。
V4はMITライセンスのオープンソースとして公開されており、商用利用が可能です。モデルウェイトはHugging Faceでプレビュー版が公開されています。
料金とベンチマーク:GPT-5.5・Claude Opus 4.7との比較
APIの料金面での差は大きいです。V4-ProはAPIで入力100万トークンあたり$1.74、出力100万トークンあたり$3.48で提供されています。GPT-5.5が入力$5.00・出力$30.00、Claude Opus 4.7が入力$5.00・出力$25.00であることと比べると、V4-ProのAPIコストはGPT-5.5の約7分の1、Claude Opus 4.7の約6分の1です(参考)。
V4-Flashはさらに安価で、入力$0.14・出力$0.28。GPT-5.5と比較すると約100分の1のコストです。
ただし、ベンチマーク上の性能ではまだ差があります。GPQA Diamondでは、V4-Pro-Maxが90.1%に対しGPT-5.5が93.6%、Claude Opus 4.7が94.2%。Humanity’s Last Examはツールなしでは37.7%対41.4%(GPT-5.5)・46.9%(Claude Opus 4.7)。SWE-Bench ProではV4の55.4%に対してClaude Opus 4.7が64.3%と差があります。
V4-Pro-MaxがリードしているのはBrowseComp(83.4%)で、Claude Opus 4.7の79.3%を上回り、GPT-5.5の84.4%に肉薄しています。フロンティアモデルすべてを凌駕しているわけではないものの、エージェントウェブブラウジングやターミナル操作では十分に競争力のある水準です。
コストパフォーマンスで見れば、GPT-5.5やClaude Opus 4.7のAPIを使うよりもV4-Proで処理できるタスクの経済的合理性が大幅に変わります。これまでコストを理由に見送っていた推論集約型の処理が現実的な選択肢になるケースは少なくないでしょう。
まとめ
DeepSeek V4は、オープンソースLLMとして過去最高水準の性能を持ちながら、フロンティアモデルと比べて大幅に低いAPIコストを実現しています。フロンティアを超えてはいないものの、差は縮まっており、コスト込みで評価した場合の実用性は高いです。
MITライセンスで商用利用可能、Hugging Faceでプレビュー公開済みです。エージェント処理や大量推論を検討している開発者にとって、試す価値のある選択肢です。