Claude CodeのAPIコストを大幅に削減しながら、100万トークンのコンテキストウィンドウを手に入れる方法があります。
DeepSeek V4はAnthropicのAPIと完全互換のエンドポイントを持ちます。環境変数を8行設定するだけで、Claude Codeのエージェントシステムはそのままに、モデルだけをDeepSeek V4に差し替えられます。
この記事でわかること:
- DeepSeek V4のモデル構成とClaude Codeとの関係
- 環境変数の設定手順(Linux / Mac / Windows)
[1m]サフィックスを付けないと1Mコンテキストが有効にならない理由- V4-ProとV4-Flashの使い分け
- 料金と現行プロモーションの期限
なぜClaude CodeでDeepSeek V4が動くのか
Claude Codeはモデルと会話するためにAnthropicのAPIを呼び出します。このAPIのリクエスト形式は仕様として公開されており、DeepSeek V4はこれと互換性のあるエンドポイント https://api.deepseek.com/anthropic を提供しています。
つまり「Claude Codeがどのサーバーに接続するか」を環境変数で切り替えると、エージェントのロジック自体はそのままで、モデルだけを入れ替えられます。DeepSeekは公式ドキュメントでClaude Code向けの設定手順を明示しており、意図的な統合です。
DeepSeek V4の2モデル構成
DeepSeek V4は2026年4月24日にプレビューリリースされ、同時にオープンソースとして公開されました。
DeepSeek V4-Proは総パラメータ1.6兆・アクティブ49Bの大規模モデルです。オープンソースモデルの中でエージェントコーディングのベンチマーク最高スコアを記録しており、数学・STEM・コーディングでは現行クローズドソースモデルと同水準の性能を持ちます。
DeepSeek V4-Flashは総パラメータ2840億・アクティブ13Bの軽量モデルです。V4-Proに近い推論性能を持ちながら応答速度が速く、サブエージェントや短いタスクに向いています。
どちらも1Mトークンのコンテキストウィンドウと最大38.4万トークンの出力に対応しています。
設定手順
DeepSeek APIキーは https://platform.deepseek.com/api_keys から取得します。
https://api-docs.deepseek.com/quick_start/agent_integrations/claude_code
Linux / Macの場合
ターミナルで以下を実行するか、.bashrc / .zshrc に追記します。
export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic
export ANTHROPIC_AUTH_TOKEN=<your DeepSeek API Key>
export ANTHROPIC_MODEL=deepseek-v4-pro[1m]
export ANTHROPIC_DEFAULT_OPUS_MODEL=deepseek-v4-pro[1m]
export ANTHROPIC_DEFAULT_SONNET_MODEL=deepseek-v4-pro[1m]
export ANTHROPIC_DEFAULT_HAIKU_MODEL=deepseek-v4-flash
export CLAUDE_CODE_SUBAGENT_MODEL=deepseek-v4-flash
export CLAUDE_CODE_EFFORT_LEVEL=max
Windowsの場合(PowerShell)
$env:ANTHROPIC_BASE_URL="https://api.deepseek.com/anthropic"
$env:ANTHROPIC_AUTH_TOKEN="<your DeepSeek API Key>"
$env:ANTHROPIC_MODEL="deepseek-v4-pro[1m]"
$env:ANTHROPIC_DEFAULT_OPUS_MODEL="deepseek-v4-pro[1m]"
$env:ANTHROPIC_DEFAULT_SONNET_MODEL="deepseek-v4-pro[1m]"
$env:ANTHROPIC_DEFAULT_HAIKU_MODEL="deepseek-v4-flash"
$env:CLAUDE_CODE_SUBAGENT_MODEL="deepseek-v4-flash"
$env:CLAUDE_CODE_EFFORT_LEVEL="max"
設定後はプロジェクトのディレクトリに移動し、通常通り claude コマンドを実行するだけです。
[1m]サフィックスが必要な理由
ANTHROPIC_MODEL=deepseek-v4-pro と書いた場合、実際には200Kトークンのコンテキストでしか動きません。1Mコンテキストを有効にするには deepseek-v4-pro[1m] のように [1m] サフィックスを付ける必要があります。
これはDeepSeek APIの仕様です。[1m]なしでも接続はできるため、設定が通っても気づかないまま使い続けるケースがあります。大規模なコードベースを扱う場合は特に確認しておく必要があります。
V4-ProとV4-Flashの使い分け
設定例では、メインモデル(Opus相当・Sonnet相当)にV4-Proを、HaikuとサブエージェントにV4-Flashを割り当てています。
Claude Codeは単一タスクの中で複数回モデルを呼び出します。長い推論や複数ファイルにわたるリファクタリングはV4-Proが担い、並列実行される軽作業はV4-Flashが処理するという分担です。
CLAUDE_CODE_SUBAGENT_MODEL=deepseek-v4-flash に設定することで、スループットを上げながらコストを抑えられます。
料金
DeepSeek APIの価格(2026年5月時点)は以下の通りです。
| モデル | 入力(キャッシュミス) | 出力 |
|---|---|---|
| V4-Flash | $0.14/Mトークン | $0.28/Mトークン |
| V4-Pro | $0.435/Mトークン | $0.87/Mトークン |
V4-Proは2026年5月31日15:59(UTC)までプロモーション価格として75%引きで提供されています。通常価格は入力$1.74、出力$3.48です(参考)。プロモ終了後は大幅に値上がりするため、重い用途をV4-Flashに切り替えるかどうかをその前に判断しておくとよいでしょう。
使用上の注意
この差し替えはClaude Codeのエージェント機能には手を加えません。ツール呼び出し、並列サブエージェント、セッション管理などの動作はそのまま維持されます。
ただしDeepSeekのサーバーにリクエストが送られるため、コードの内容がDeepSeekに渡ることを理解した上で利用する必要があります。機密性の高いコードを扱う場合は、利用する環境のセキュリティポリシーを確認してください。
また deepseek-chat と deepseek-reasoner という旧モデル名は2026年7月24日以降に廃止されます。現在はそれぞれ deepseek-v4-flash の非思考モード・思考モードにルーティングされているため、新規設定では deepseek-v4-flash または deepseek-v4-pro を直接指定するのが正確です。