公開からわずか2週間で、OpenRouterのデイリーランキング1位を獲得したLLMがある。TencentのオープンソースモデルHy3 previewだ。累計3.66兆トークンの使用量を記録し、週次ボリュームは前週比298%増という急成長を見せている。
この記事でわかること:
- Hy3 previewのアーキテクチャとスペック
- エージェント用途での実際の性能指標
- OpenRouterとTencent Cloud TokenHubでの使い方
- セルフホストの手順(vLLM・SGLang対応)
- 料金体系の詳細
https://github.com/Tencent-Hunyuan/Hy3-preview
Hy3 previewとは
Hy3 previewは、Tencentが2026年4月24日に公開したMixture-of-Experts(MoE)構造のオープンソースLLMだ。「Hy」シリーズは中国市場では「混元(Hunyuan)」として知られており、Hy3はその第3世代にあたる。
スペックは以下のとおりだ。
- 総パラメータ数:295B(2950億)
- 推論時のアクティブパラメータ:21B
- コンテキストウィンドウ:最大256Kトークン
MoEアーキテクチャを採用することで、2950億のパラメータを持ちながら推論時に動かすのは21Bのみに限定し、計算コストを抑えた設計になっている。同時に、MTP(Multi-Token Prediction)レイヤーに3.8Bのパラメータを備えており、推論の品質と効率を両立している。
OpenRouterで急速に普及した理由
リリースと同時に、OpenRouterでは2週間限定の無料APIアクセスが提供された。この期間に開発者が競うように試した結果、2週間で3.66兆トークンという使用量を記録してデイリーランキング1位を獲得し、週次ボリュームも前週比298%増という急成長を見せた。
特にエージェント開発やコーディングタスクでの評価が高く、開発者コミュニティで「オープンソースのエージェント・コーディング分野が変わりつつある」という声が広がった形だ。
エージェント向け機能と実績
Hy3 previewが力を入れているのがマルチステップのエージェント実行だ。Tencent社内の実証では、最大495ステップの連続エージェントワークフローを安定して動作させた。文書処理、データ分析、情報検索、MCP(Model Context Protocol)を使ったツールチェーン連携など、幅広い業務シナリオで活用されている。
推論モードは「無効・低・高」の3段階で切り替え可能で、タスクの複雑さに応じてスピードと思考深度を調整できる。
Tencentの社内製品への導入でも具体的な成果が出ている。「WorkBuddy」と「CodeBuddy」への適用後、最初のトークン生成時間(TTFT)が54%低下し、エンド・ツー・エンドの応答時間が47%短縮した。処理成功率は99.99%以上を維持している(Tencent公式情報)。また、TencentのドキュメントツールのAI PPT生成機能では、前モデル(Hy2)比で生成成功率が20%向上した。
推論効率は全体として40%改善されており、同等のコストでより高い性能を引き出せる構成になっている。
使い方
OpenRouterでのAPIアクセス
最も手軽に試せるのがOpenRouter経由でのAPI利用だ。
https://openrouter.ai/tencent/hy3-preview:free
OpenAI互換のエンドポイントで呼び出せるため、既存のコードをほぼ変更せずに試せる。無料枠の有無はモデルページで都度確認が必要だ。
Tencent Cloud TokenHubのAPIを使う
Tencent Cloud TokenHubでは個別のAPIキーを取得して利用できる。OpenClaw、OpenCode、KiloCodeなどのエージェントフレームワークとの接続にも対応している。月額プランは個人向けが約4.10ドルから用意されており、エージェントフレームワーク内から定額で継続的に使用できる。
セルフホストする
Hy3 previewのモデルウェイトはHugging Face、GitHub、ModelScope、GitCodeから入手できる。推論フレームワークはvLLMとSGLangに対応しており、ダウンロード後そのままデプロイ可能だ。
# vLLMで起動する例
vllm serve tencent/Hy3-preview
料金
Tencent Cloud TokenHubでのAPI料金は以下のとおりだ。
| 項目 | 料金 |
|---|---|
| 入力(通常) | 約0.18ドル/100万トークン |
| 入力(キャッシュ済み) | 約0.06ドル/100万トークン |
| 出力 | 約0.59ドル/100万トークン |
入力コストは閉鎖型モデルと比べて低水準に設定されており、エージェントタスクのように入出力量が多い用途では差が大きくなる。OpenRouterに掲載されているサードパーティプロバイダー経由での料金とは異なる場合があるため、利用前にOpenRouterのモデルページで最新情報を確認するとよい。
まとめ
Hy3 previewは295B規模のMoEモデルながら、推論時のアクティブパラメータを21Bに限定して計算コストを抑えている。公開2週間でOpenRouterのデイリーランキング1位を獲得し、エージェント用途での実力が早期に評価された。OpenRouter経由のAPI、Tencent Cloud TokenHub、セルフホストの3つの利用経路があり、用途に応じて選べる。