公開からわずか2週間で、OpenRouterのデイリーランキング1位を獲得したLLMがある。TencentのオープンソースモデルHy3 previewだ。累計3.66兆トークンの使用量を記録し、週次ボリュームは前週比298%増という急成長を見せている。

この記事でわかること:

  • Hy3 previewのアーキテクチャとスペック
  • エージェント用途での実際の性能指標
  • OpenRouterとTencent Cloud TokenHubでの使い方
  • セルフホストの手順(vLLM・SGLang対応)
  • 料金体系の詳細

https://github.com/Tencent-Hunyuan/Hy3-preview

Hy3 previewとは

Hy3 previewは、Tencentが2026年4月24日に公開したMixture-of-Experts(MoE)構造のオープンソースLLMだ。「Hy」シリーズは中国市場では「混元(Hunyuan)」として知られており、Hy3はその第3世代にあたる。

スペックは以下のとおりだ。

  • 総パラメータ数:295B(2950億)
  • 推論時のアクティブパラメータ:21B
  • コンテキストウィンドウ:最大256Kトークン

MoEアーキテクチャを採用することで、2950億のパラメータを持ちながら推論時に動かすのは21Bのみに限定し、計算コストを抑えた設計になっている。同時に、MTP(Multi-Token Prediction)レイヤーに3.8Bのパラメータを備えており、推論の品質と効率を両立している。

OpenRouterで急速に普及した理由

リリースと同時に、OpenRouterでは2週間限定の無料APIアクセスが提供された。この期間に開発者が競うように試した結果、2週間で3.66兆トークンという使用量を記録してデイリーランキング1位を獲得し、週次ボリュームも前週比298%増という急成長を見せた。

特にエージェント開発やコーディングタスクでの評価が高く、開発者コミュニティで「オープンソースのエージェント・コーディング分野が変わりつつある」という声が広がった形だ。

エージェント向け機能と実績

Hy3 previewが力を入れているのがマルチステップのエージェント実行だ。Tencent社内の実証では、最大495ステップの連続エージェントワークフローを安定して動作させた。文書処理、データ分析、情報検索、MCP(Model Context Protocol)を使ったツールチェーン連携など、幅広い業務シナリオで活用されている。

推論モードは「無効・低・高」の3段階で切り替え可能で、タスクの複雑さに応じてスピードと思考深度を調整できる。

Tencentの社内製品への導入でも具体的な成果が出ている。「WorkBuddy」と「CodeBuddy」への適用後、最初のトークン生成時間(TTFT)が54%低下し、エンド・ツー・エンドの応答時間が47%短縮した。処理成功率は99.99%以上を維持している(Tencent公式情報)。また、TencentのドキュメントツールのAI PPT生成機能では、前モデル(Hy2)比で生成成功率が20%向上した。

推論効率は全体として40%改善されており、同等のコストでより高い性能を引き出せる構成になっている。

使い方

OpenRouterでのAPIアクセス

最も手軽に試せるのがOpenRouter経由でのAPI利用だ。

https://openrouter.ai/tencent/hy3-preview:free

OpenAI互換のエンドポイントで呼び出せるため、既存のコードをほぼ変更せずに試せる。無料枠の有無はモデルページで都度確認が必要だ。

Tencent Cloud TokenHubのAPIを使う

Tencent Cloud TokenHubでは個別のAPIキーを取得して利用できる。OpenClaw、OpenCode、KiloCodeなどのエージェントフレームワークとの接続にも対応している。月額プランは個人向けが約4.10ドルから用意されており、エージェントフレームワーク内から定額で継続的に使用できる。

セルフホストする

Hy3 previewのモデルウェイトはHugging Face、GitHub、ModelScope、GitCodeから入手できる。推論フレームワークはvLLMとSGLangに対応しており、ダウンロード後そのままデプロイ可能だ。

# vLLMで起動する例
vllm serve tencent/Hy3-preview

料金

Tencent Cloud TokenHubでのAPI料金は以下のとおりだ。

項目 料金
入力(通常) 約0.18ドル/100万トークン
入力(キャッシュ済み) 約0.06ドル/100万トークン
出力 約0.59ドル/100万トークン

入力コストは閉鎖型モデルと比べて低水準に設定されており、エージェントタスクのように入出力量が多い用途では差が大きくなる。OpenRouterに掲載されているサードパーティプロバイダー経由での料金とは異なる場合があるため、利用前にOpenRouterのモデルページで最新情報を確認するとよい。

まとめ

Hy3 previewは295B規模のMoEモデルながら、推論時のアクティブパラメータを21Bに限定して計算コストを抑えている。公開2週間でOpenRouterのデイリーランキング1位を獲得し、エージェント用途での実力が早期に評価された。OpenRouter経由のAPI、Tencent Cloud TokenHub、セルフホストの3つの利用経路があり、用途に応じて選べる。