SWE-Bench Proで世界トップ(58.4%)を記録したオープンソースのコーディングモデル「GLM-5.1」が、BytePlus経由で月3ドルから使える。Claude CodeやOpenClawにそのまま接続できる点も注目されている。

この記事でわかること:

  • GLM-5.1の性能とClaude Opus 4.6との比較
  • BytePlus Coding Planの料金体系
  • Claude Codeへの接続設定
  • クォータ消費の注意点

GLM-5.1はどんなモデルか

https://z.ai

Z.ai(旧Zhipu AI)が2026年4月7日にリリースしたコーディング特化モデル。パラメータ数は約754B(MoEアーキテクチャ)で、重みはHugging Faceで公開、ライセンスはMIT。商用利用・改変・再配布が制限なく行える。

最大の特徴は長時間自律実行だ。従来のモデルはコーディングタスクで数十ターン後に行き詰まることが多い。GLM-5.1はその壁を突破するため、行き詰まりを自ら検知して戦略を切り替える設計になっている。

Z.aiの内部実験では、ベクターデータベースの最適化タスクを600回以上のイテレーション(6,000回超のツール呼び出し)で実行し、検索スループットをClaude Opus 4.6の最良結果(3,547 QPS)から21,500 QPSまで6倍以上に改善している。また、スターターコードなしで8時間かけてLinuxライクなデスクトップ環境をブラウザアプリとして構築するデモも公開されている。

コーディングのベンチマーク結果は以下のとおり(参考)。

ベンチマーク GLM-5.1 GPT-5.4 Claude Opus 4.6
SWE-Bench Pro 58.4% 57.7% 57.3%
NL2Repo 42.7% 41.3% 33.4%
CyberGym 68.7%
Terminal-Bench 2.0 63.5% 68.5%

一方、GPQA-DiamondなどのSTEM推論ではGPT-5.4やGeminiに後れを取る。Z.ai自身も「コーディング特化の初歩」と位置づけており、汎用推論より長時間タスクの実行能力に重点を置いていることを明示している。

BytePlus Coding Planとは

https://www.byteplus.com/en/activity/codingplan

BytePlusはByteDanceのB2Bクラウドプラットフォーム。ModelArk Coding PlanはGLM-5.1を中心としたサブスクリプション型のコーディングAIサービスで、API経由でClaude Code・OpenCode・OpenClaw・TRAE・Hermes Agentなどの主要ツールと接続できる。

同じGLM-5.1の重みを使いながら、Z.aiの直接APIより低いコストで提供している点がユーザーに注目されている。Aria Westcottの検証によると、BytePlus経由のコストはZ.ai直接APIの約1/5に相当するという(参考)。

料金と含まれる機能

プランは3段階。2026年4月時点での価格は以下のとおり。

プラン 通常月額 初月プロモ 5時間あたりのリクエスト数 月間検索数
Lite $10 $3 120 100
Pro $30 $15 600 1,000
Max 要問合せ 増量 4,000

含まれるモデルはGLM-5.1・GLM-5・GLM-5-Turbo・GLM-4.7。追加機能としてWeb Search MCP・Web Reader MCP・Zread MCPが付属し、ビジョン理解にも対応する。生成速度は55トークン/秒以上とされている。

Z.ai直接APIの価格はOpenRouterで1Mトークンあたり入力$1.05・出力$3.50。月間のコーディング用途に特化するなら、サブスクリプション型のCoding Planのほうがコスト効率が高くなるケースが多い。

Claude Codeへの接続設定

Byteplus公式ドキュメントではClaude Codeとの統合手順が専用ページで解説されている。~/.claude/settings.json内のmodelキーをGLM-5.1に変更することで既存のClaude Code環境に接続できる。

{
  "model": "GLM-5.1"
}

OpenCode・OpenClaw・TRAE・Hermes Agentといった他の主要コーディングツールも同様にサポートされており、ツールごとの設定手順がByteplus公式ドキュメントにまとめられている。

ピーク時間帯のクォータ消費に注意

Coding Planのクォータ消費は時間帯によって異なる。

  • ピーク時間(UTC+8の14:00〜18:00、日本時間15:00〜19:00): 通常の3倍消費
  • オフピーク時: 通常の2倍消費
  • 2026年4月末まで(プロモーション): オフピーク時は1倍消費

Liteプランを選ぶ場合、ピーク帯に集中して使うとリクエスト数が想定より早く枯渇する。コスト効率を最大化するなら、日本時間の深夜〜午前中を中心に使うのが実際的だ。

コストを抑えながらClaude Code環境を維持する

GLM-5.1はコーディングタスクにフォーカスしており、Claude MaxやGPT-5.4の直接APIと比べて同等水準の性能をはるかに低い料金で提供している。MITライセンスでローカルデプロイも可能なため、vLLMやSGLangを使った自前のホスティングという選択肢もある。

BytePlus Coding PlanはClaude Codeとの互換性を維持したまま運用コストを圧縮できる。コーディングエージェントをチームで常用している場合、まず初月プロモで試してみるのが現実的なアプローチだ。