Claude CodeのAPIコストを大幅に削減しながら、100万トークンのコンテキストウィンドウを手に入れる方法があります。

DeepSeek V4はAnthropicのAPIと完全互換のエンドポイントを持ちます。環境変数を8行設定するだけで、Claude Codeのエージェントシステムはそのままに、モデルだけをDeepSeek V4に差し替えられます。

この記事でわかること:

  • DeepSeek V4のモデル構成とClaude Codeとの関係
  • 環境変数の設定手順(Linux / Mac / Windows)
  • [1m]サフィックスを付けないと1Mコンテキストが有効にならない理由
  • V4-ProとV4-Flashの使い分け
  • 料金と現行プロモーションの期限

なぜClaude CodeでDeepSeek V4が動くのか

Claude Codeはモデルと会話するためにAnthropicのAPIを呼び出します。このAPIのリクエスト形式は仕様として公開されており、DeepSeek V4はこれと互換性のあるエンドポイント https://api.deepseek.com/anthropic を提供しています。

つまり「Claude Codeがどのサーバーに接続するか」を環境変数で切り替えると、エージェントのロジック自体はそのままで、モデルだけを入れ替えられます。DeepSeekは公式ドキュメントでClaude Code向けの設定手順を明示しており、意図的な統合です。

DeepSeek V4の2モデル構成

DeepSeek V4は2026年4月24日にプレビューリリースされ、同時にオープンソースとして公開されました。

DeepSeek V4-Proは総パラメータ1.6兆・アクティブ49Bの大規模モデルです。オープンソースモデルの中でエージェントコーディングのベンチマーク最高スコアを記録しており、数学・STEM・コーディングでは現行クローズドソースモデルと同水準の性能を持ちます。

DeepSeek V4-Flashは総パラメータ2840億・アクティブ13Bの軽量モデルです。V4-Proに近い推論性能を持ちながら応答速度が速く、サブエージェントや短いタスクに向いています。

どちらも1Mトークンのコンテキストウィンドウと最大38.4万トークンの出力に対応しています。

設定手順

DeepSeek APIキーは https://platform.deepseek.com/api_keys から取得します。

https://api-docs.deepseek.com/quick_start/agent_integrations/claude_code

Linux / Macの場合

ターミナルで以下を実行するか、.bashrc / .zshrc に追記します。

export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic
export ANTHROPIC_AUTH_TOKEN=<your DeepSeek API Key>
export ANTHROPIC_MODEL=deepseek-v4-pro[1m]
export ANTHROPIC_DEFAULT_OPUS_MODEL=deepseek-v4-pro[1m]
export ANTHROPIC_DEFAULT_SONNET_MODEL=deepseek-v4-pro[1m]
export ANTHROPIC_DEFAULT_HAIKU_MODEL=deepseek-v4-flash
export CLAUDE_CODE_SUBAGENT_MODEL=deepseek-v4-flash
export CLAUDE_CODE_EFFORT_LEVEL=max

Windowsの場合(PowerShell)

$env:ANTHROPIC_BASE_URL="https://api.deepseek.com/anthropic"
$env:ANTHROPIC_AUTH_TOKEN="<your DeepSeek API Key>"
$env:ANTHROPIC_MODEL="deepseek-v4-pro[1m]"
$env:ANTHROPIC_DEFAULT_OPUS_MODEL="deepseek-v4-pro[1m]"
$env:ANTHROPIC_DEFAULT_SONNET_MODEL="deepseek-v4-pro[1m]"
$env:ANTHROPIC_DEFAULT_HAIKU_MODEL="deepseek-v4-flash"
$env:CLAUDE_CODE_SUBAGENT_MODEL="deepseek-v4-flash"
$env:CLAUDE_CODE_EFFORT_LEVEL="max"

設定後はプロジェクトのディレクトリに移動し、通常通り claude コマンドを実行するだけです。

[1m]サフィックスが必要な理由

ANTHROPIC_MODEL=deepseek-v4-pro と書いた場合、実際には200Kトークンのコンテキストでしか動きません。1Mコンテキストを有効にするには deepseek-v4-pro[1m] のように [1m] サフィックスを付ける必要があります。

これはDeepSeek APIの仕様です。[1m]なしでも接続はできるため、設定が通っても気づかないまま使い続けるケースがあります。大規模なコードベースを扱う場合は特に確認しておく必要があります。

V4-ProとV4-Flashの使い分け

設定例では、メインモデル(Opus相当・Sonnet相当)にV4-Proを、HaikuとサブエージェントにV4-Flashを割り当てています。

Claude Codeは単一タスクの中で複数回モデルを呼び出します。長い推論や複数ファイルにわたるリファクタリングはV4-Proが担い、並列実行される軽作業はV4-Flashが処理するという分担です。

CLAUDE_CODE_SUBAGENT_MODEL=deepseek-v4-flash に設定することで、スループットを上げながらコストを抑えられます。

料金

DeepSeek APIの価格(2026年5月時点)は以下の通りです。

モデル 入力(キャッシュミス) 出力
V4-Flash $0.14/Mトークン $0.28/Mトークン
V4-Pro $0.435/Mトークン $0.87/Mトークン

V4-Proは2026年5月31日15:59(UTC)までプロモーション価格として75%引きで提供されています。通常価格は入力$1.74、出力$3.48です(参考)。プロモ終了後は大幅に値上がりするため、重い用途をV4-Flashに切り替えるかどうかをその前に判断しておくとよいでしょう。

使用上の注意

この差し替えはClaude Codeのエージェント機能には手を加えません。ツール呼び出し、並列サブエージェント、セッション管理などの動作はそのまま維持されます。

ただしDeepSeekのサーバーにリクエストが送られるため、コードの内容がDeepSeekに渡ることを理解した上で利用する必要があります。機密性の高いコードを扱う場合は、利用する環境のセキュリティポリシーを確認してください。

また deepseek-chatdeepseek-reasoner という旧モデル名は2026年7月24日以降に廃止されます。現在はそれぞれ deepseek-v4-flash の非思考モード・思考モードにルーティングされているため、新規設定では deepseek-v4-flash または deepseek-v4-pro を直接指定するのが正確です。