ビジネス上の質問を投げるだけで、データ分析からレポート出力までを人手なしで回せる時代が、新しい大規模モデルの登場で一段と現実味を帯びました。

2026年6月30日、中国の美团(Meituan)が次世代基盤モデル「LongCat-2.0」を公開しました。総パラメータ数1.6兆のMoE(Mixture of Experts)モデルで、エージェント型のコーディングと長文脈処理を主眼に置いています。7月2日の公式X投稿では、コミュニティユーザーがLongCat-2.0上に構築した「AI SQL Agent」が紹介され、自然言語の質問1件からビジネスレポートまでをSQL知識なしで自動化できるユースケースが示されました(参考)。

この記事では、LongCat-2.0の技術的な位置づけと、SQL不要のデータ分析エージェントが何を変えるのかを整理します。

この記事でわかること

  • LongCat-2.0の基本スペックと、従来のチャットモデルとの違い
  • AI SQL Agentが質問からレポート生成まで担う処理の流れ
  • 国産チップ5万枚クラスターでの学習という背景
  • 開発者がモデルを試すための入手経路

LongCat-2.0は「会話」より「タスク実行」向けの基盤モデル

https://www.longcatai.org/

LongCat-2.0は、美团のAI研究チームLongCatが公開した大規模言語モデルです。GitHubのREADMEによれば、総パラメータ数は1.6兆、1トークンあたりの活性化パラメータ数は約480億で、トークンの複雑さに応じて330億〜560億の範囲で動的に切り替わります(参考)。

モデルウェイトはMITライセンスで公開予定です。現時点ではGitHubとHugging Faceに「Model weights coming soon」と記載されており、重みファイルの全面配布はこれからとなります。

美团はLongCat-2.0を単なる対話モデルではなく、AIエージェント・コード生成・長文脈処理・自動化ワークフロー向けの基盤として位置づけています。公式サイトでは、ネイティブ100万トークンのコンテキスト、LongCat Sparse Attention(LSA)、ゼロ計算エキスパート、MOPD(Multi-Teacher On-Policy Distill)によるエキスパート融合を主要な技術要素として挙げています。

課題は「データ分析にSQLと専門知識が必要なこと」

社内の売上データや在庫データを分析したい場面で、多くのビジネス担当者はSQLを書けません。データチームに依頼すれば数日かかり、ダッシュボードを見ても「なぜその数字なのか」の背景が読み取れないこともあります。

LongCat-2.0が標榜するAI SQL Agentは、この壁を取り除く設計です。美团の内測事例では、業務担当者が「先月どの商品の売上が最も伸びたか」と自然言語で質問すると、モデルが時間範囲・指標・並べ替え条件を解釈し、必要なテーブルと結合関係を特定してSQLを生成・実行し、結果をビジネス洞察に変換すると説明されています(参考)。

7月2日の公式X投稿で紹介されたのは、コミュニティユーザーsilenceallatがLongCat-2.0上に構築したAI SQL Agentです。投稿では「Turn any business question into a full data report—automatically(ビジネス上の質問を、自動で完全なデータレポートに変える)」と説明され、質問1件からビジネスレポート出力までをSQL不要・人手介入なしで完結させるデモが示されています。

処理の流れは次の4段階に分けられます。

  1. 自然言語の質問を解析し、時間範囲・対象指標・集計ルールを特定する
  2. データベースのスキーマを踏まえ、必要なテーブル結合と集計手順を計画する
  3. SQLを生成して実行し、結果を取得する
  4. 数値をビジネス文脈のあるレポート文に変換する

従来はデータエンジニアがSQLを書き、分析担当が結果を解釈する二段構えでした。LongCat-2.0を基盤にしたエージェントは、この一連の処理をモデル側で自律的に回す想定です。

国産チップ5万枚クラスターで学習した1.6兆パラメータモデル

LongCat-2.0のもう一つの注目点は、学習インフラです。美团は、業界初の1兆パラメータ超モデルとして、国産AI ASIC(専用集積回路)の5万枚規模クラスター上で学習と大規模推論の全工程を完遂したと発表しています(参考)。

GitHubのREADMEでは、35兆トークン超のデータで学習し、ロールバックや回復不能な損失スパイクなしに学習を完走したと記載されています。性能面では、美团はGemini 3.1 Proと同等水準と主張しており、GitHub上のベンチマーク表ではSWE-bench Proで59.5点(GPT-5.5の58.6点を上回る)、Terminal-Bench 2.1で70.8点を記録しています。

正式公開前、LongCat-2.0はOpenRouter上で匿名モデル「Owl Alpha」として配信されていました。VentureBeatの報道によれば、2か月間グローバル開発者向けチャートで上位に入り、正式名称の公開後もOpenRouterのグローバル呼び出し量トップ3に入るモデルとして位置づけられています(参考)。

開発者がモデルを試す経路

https://longcat.ai

LongCat-2.0は、公式チャットサイトlongcat.ai、OpenRouter、GitHubリポジトリ、Hugging Faceからアクセスできます。APIプラットフォームはOpenAI APIとAnthropic APIの両形式に対応しており、既存のSDKをエンドポイントとキーの差し替えだけで使える設計です。

Claude Code、OpenClaw、Hermesなどのエージェントフレームワーク向けにも最適化されています。コードベース全体を100万トークンのコンテキストに載せ、リポジトリ単位の移行やマルチファイルのリファクタリングを自律的に進める用途を想定したモデルです。

7月2日のX投稿では「LongCat-2.0 just launched — limited-time(LongCat-2.0がローンチ、期間限定)」と記載されており、現時点では限定公開の案内が出ています。Coding PlanとAPIは当面中国国内向けの提供が中心で、国際的な検証はウェイトの全面公開とAPIの海外展開を待つ必要があります。

チャットモデルとの使い分け

LongCat-2.0はエージェント型タスクに強みを持つ一方、単発の質問応答では性能が出にくい場面も報告されています。独立テストではTeenBench 3で21.6%という低スコアが出たとの指摘があり、これはモデルがマルチステップのツール呼び出しと反復実行を前提に設計されているため、ワンショットのQ&Aベンチマークとの相性が悪いことが原因と分析されています(参考)。

単純な雑談や短文生成が目的なら、軽量なチャット特化モデルの方がコストと応答速度で有利です。SQLを含むデータ分析、コードベースの移行、長文ドキュメントの処理など、複数ステップの自律実行が必要な場面ではLongCat-2.0の設計思想が活きます。

ビジネス担当者がSQLを書かずにデータレポートを得るユースケースは、その典型例です。質問の意図理解からクエリ生成、結果の解釈までを一気通貫で担うエージェント設計が、LongCat-2.0の公開で具体化しつつあります。