中国の配達アプリ大手Meituanが、エージェント型コーディング向けの大規模言語モデル「LongCat-2.0」を2026年6月30日に公開しました。1.6兆パラメータ規模で、学習から推論まで5万枚の国産チップだけで完結した点が注目を集めています。

この記事では、LongCat-2.0の技術的な位置づけと、開発者にとどのような意味を持つかを整理します。

この記事でわかること

  • LongCat-2.0の規模・用途・ライセンスの概要
  • 国産チップ5万枚クラスターで学習した背景と意味
  • OpenRouterで匿名公開されていた「Owl Alpha」との関係
  • ベンチマーク結果と現時点での利用方法

配達アプリ企業が放った1.6兆パラメータのコーディング特化LLM

Meituanは配達・宿泊予約などを手がける中国のテック企業です。AI研究チーム「LongCat」は2023年に発足し、初のモデルは2025年後半に登場しました。競合にはDeepSeekやByteDanceのDoubaoなど、資金力のある中国AIラボが並びますが、Meituanは後発ながら大規模モデルの公開まで踏み込んでいます。

LongCat-2.0はMixture-of-Experts(MoE)構造の大規模言語モデルです。MoEは、入力ごとに一部の「専門家」ネットワークだけを起動する設計で、総パラメータ数を増やしつつ計算コストを抑えられます。総パラメータ数は1.6兆、1トークンあたりに動的に起動するのは330億〜560億(平均約480億)です。会話汎用よりも、ツール連携やリポジトリ操作を伴うエージェント型コーディングに特化した設計です。

ライセンスはMITで、GitHubとHugging Faceにリポジトリが公開されています。ただし現時点ではウェイト本体は未公開で、READMEには「Model weights coming soon」と記載されています。アーキテクチャと技術文書は入手できる一方、自前ホストはウェイト公開を待つ必要があります。

米国製GPUに頼らない学習が示す中国AIの自給路線

2022年以降、米国は高性能AIチップの対中輸出を制限しています。中国側はHuaweiやEnflameなど国産チップメーカーの育成を進め、AI開発の自給率を高めています。多くの中国製モデルは推論を国産チップで動かす例はあっても、学習まで国産だけで完結した例は限られてきました。

MeituanはLongCat-2.0を5万枚の国産ASIC(用途特化型半導体)スーパーポッドで、ゼロから学習したと発表しています。1兆パラメータ超のモデルで、学習と推論の両方を国産クラスターだけで完結させた初の事例だと主張しています。チップメーカー名は公表していませんが、Reutersの報道ではHuaweiやEnflameが市場シェアを広げている流れが触れられています。

GitHubの技術文書によると、学習は3,500万アクセラレータ時間超35兆トークン超のデータで行われ、ロールバックや回復不能な損失スパイクなく完走したとしています。Meituanは「国内コンピュートクラスターで大規模モデル学習が可能になった」と述べ、2023年から国産チップの検証を始めた経緯も明かしています。

100万トークン文脈とスパースアテンション

エージェントが巨大なコードベースを一度に扱うには、長いコンテキストが欠かせません。LongCat-2.0は100万トークンの文脈長をネイティブにサポートします。公式サイトの比較では、業界標準の12万8千トークン級と並べ、超長文ドキュメントやリポジトリ全体を入力に載せられる点を打ち出しています。

100万トークンを現実的なコストで扱うため、MeituanはLongCat Sparse Attention(LSA)を導入しています。通常のアテンションは文脈が長くなるほど計算が二乗で増えますが、LSAは重要な情報だけを選んで参照するスパース(疎)な方式です。ストリーミング対応のインデックス、層をまたぐインデックス共有、粗い絞り込みから細かい選択へ進む階層型インデックスなど、複数の工夫で線形に近いコストを目指しています。

さらにZero-Computation Expertsにより、単純なトークンは計算を省略し、複雑なトークンだけ多くのリソースを割り当てます。ポスト学習ではMOPD(Multi-Teacher On-Policy Distill)で、エージェント実行・推論・対話の3系統の専門家を統合し、実行時にゲートがタスクに応じてルーティングします。

OpenRouterで匿名公開されていたOwl Alphaの正体

https://openrouter.ai/

LongCat-2.0のプレビュー版は、公開前からAIモデルマーケットプレイスOpenRouterで匿名モデル「Owl Alpha」として配信されていました。Meituanは、Owl AlphaがOpenRouterの利用量トップ3に入っていたと発表しています。

VentureBeatの報道では、Owl Alphaは月間約10.1兆トークン(1日平均5590億トークン)を処理し、前月比242%の伸びで急成長したとされています。Hermes Agentワークスペースでは1位、Claude Code展開では2位、OpenClaw環境では3位を記録したとも報じられています。性能が検証された後にブランドを明かす、いわゆるステルス公開の成功例として語られています。

コーディングベンチマークで示された実力

Meituanが公表したベンチマークでは、LongCat-2.0はソフトウェア工学タスクで主要モデルと競合できるスコアを示しています。

ベンチマーク LongCat-2.0 比較対象の例
SWE-bench Pro 59.5 GPT-5.5(58.6)、Gemini 3.1 Pro(54.2)
Terminal-Bench 2.1 70.8 実ターミナル操作の評価
SWE-bench Multilingual 77.3 Claude Opus 4.6(77.8)に近い

SWE-bench Proは実際のソフトウェア課題を解かせる評価で、LongCat-2.0はGPT-5.5をわずかに上回る59.5を記録しています。CNAの報道では、Meituanは性能をGoogleのGemini 3.1 Pro(2026年2月公開)と同等と述べています。一方、汎用エージェントやブラウジング系の一部ベンチマークでは、Claude Opus 4.8など最上位モデルに及ばない項目もあり、コーディング特化であることが数値にも表れています。

いま試せる利用経路と今後の見通し

https://longcat.ai

https://github.com/meituan-longcat/LongCat-2.0

現時点でLongCat-2.0を触れる主な経路は、公式チャットサイトlongcat.aiOpenRouter経由のAPIです。MeituanのAPIプラットフォームでも利用できます。コンテキストキャッシュヒットは無料、標準料金は入力100万トークンあたり0.75ドル・出力2.95ドル、期間限定プロモでは入力0.30ドル・出力1.20ドルと、高性能モデルの中では低めの価格帯に置かれています。

Meituanは既存事業への組み込み方は詳しく説明していませんが、レストランやホテルの推薦、注文・予約の代行など、配達アプリ内のAIアシスタントに先行モデルを使ってきた経緯があります。今回の公開文書では、ゲームサイト構築や小説執筆といったデモ用途も紹介され、収益源の多角化を意識した姿勢がうかがえます。

ウェイトの完全公開とセルフホスト手順は「近日公開」とされています。MITライセンスのため、企業は改変・再配布・独自製品への組み込みが比較的自由です。一方、1.6兆パラメータ規模のため、一般のPCでのローカル実行は現実的ではなく、データセンターやクラウド上の推論クラスターが前提になります。

LongCat-2.0は、中国企業が国産チップだけでフロンティア級のコーディングモデルを学習できた事例として、半導体とAIの両面で象徴的なリリースです。ウェイト公開前からOpenRouterで実利用が積み上がっていた点は、性能がベンチマーク表だけでなく開発者の選択にも裏付けられていることを示しています。エージェント型開発のコストと文脈長の制約に悩むチームにとって、公開後のセルフホストとAPI価格の動向は引き続き注目に値します。