テキストから3Dゲームアセットを作る工程が、数日から数分に縮まりました。AI画像生成と3D変換を組み合わせれば、モデリングの専門知識がなくてもリグ付きキャラクターを量産できます。

この記事でわかること

  • AI画像→3Dパイプラインの全体像と各ツールの役割
  • GPT Image 2とFLUX.2 Kleinの使い分け
  • Meshy v6でリグ付きGLBを出力するまでの流れ
  • fal.aiで全工程をAPIとして組む方法
  • コストと制約の目安

パイプラインの全体像

従来、3Dキャラクターを1体作るには、コンセプトアート→モデリング→UV展開→テクスチャ→リギング→アニメーションという工程を経る必要がありました。各工程に専用ソフトと専門スキルが必要で、1体あたり数日〜数週間かかります。

2026年現在、以下の3ステップで代替できるパイプラインが実用段階に入っています。

  1. 画像生成 — GPT Image 2またはFLUX.2 Klein 9Bでキャラクター画像を生成
  2. 3D変換 — Meshy v6のimage-to-3DでPBRテクスチャ付き3Dモデルに変換
  3. リギング+アニメーシ��ン — Meshy v6の自動リグで骨格を入れ、プリセットアニメーションを適用してGLBで出力

すべてfal.aiのAPIから呼び出せるため、コードだけで完結します。

ステップ1:キャラクター画像の生成

GPT Image 2を使う場合

OpenAIの最新画像生成モデルです。2026年4月25日にfal.aiが公式パートナーAPIとして提供を開始しました。テキストの描画精度とフォトリアリズムが前世代から大幅に向上しています。

キャラクター生成に向いている理由は、プロンプトの指示どおりにポーズ・衣装・表情を制御しやすい点です。「正面向き・Tポーズ・白背景」のように3D変換に適した条件を指定すると、後工程の精度が上がります。

fal.ai経由の料金は1024×1024のMedium品質で1枚あたり約$0.06です。High品質でも$0.22で、試行錯誤しやすい価格帯に収まっています。

FLUX.2 Klein 9Bを使う場合

Black Forest Labsが2026年1月15日にリリースした高速画像生成モデルです。9Bパラメータながら4ステップの推論で0.5秒未満の生成速度を実現しています。

GPT Image 2との使い分けは明確です。FLUX.2 Kleinはリアルタイム性が必要な場面、たとえばユーザーがWebアプリ上でキャラクターをカスタマイズする「ライブ生成」に適して��ます。品質はGPT Image 2にやや劣りますが、レスポンス速度が圧倒的に速いため、インタラクティブな用途では優先されます。

FLUX.2 Klein 9Bはオープンウェイトで公開されており、ローカル実行も可能です。RTX 4090以上のGPU(VRAM 29GB)があれば手元で動かせます。4Bモデルを選べばRTX 3090/4070(13GB VRAM)でも動作します。

ステップ2:Meshy v6で画像を3Dモデルに変換

Meshy v6は2026年1月18日にリリースされたimage-to-3Dモデルです。1枚の画像から約1分でPBRテクスチャ(ベースカラー・メタリック・ラフネス・法線マップ)付きの3Dメッシュを生成します。

前バージョンからの主な改善点は3つです。

  • ジオメトリ品質の向上 — キャラクターの顔や手指の構造が自然になり、手作業での修正が減った
  • ハードサーフェスの精度 — メカや建物のエッジがシャープになった
  • トポロジー選択 — クアッド(有機的な形状向き)とトライアングル(ディテール重視)を切り替えられる

ポリゴン数は100〜300,000の範囲で指定できます。ゲーム用途なら10,000〜50,000程度、WebGL表示なら5,000以下が目安です。

入力画像のコツ

3D変換の精度を上げるには、入力画像に以下の条件を満たさせます。

  • 背景は白または単色(複雑な背景はメッシュにノイズが入る)
  • キャラクター全身が収まっている
  • ライティングが均一(強い影がないほうがテクスチャが正確になる)

ステップ1でプロンプトに「white background, full body, T-pose, even lighting」と指定しておくと、この条件を自然に満たせます。

ステップ3:自動リグとアニメーション適用

Meshy v6はimage-to-3Dの後工程として自動リギングを提供しています。人型キャラクター、二足歩行、四足歩行、スタイライズドフィギュアに対応し、リグの生成は30秒以内に完了します。

リグが入った後は、500種類以上のプリセットアニメ���ション(歩行、走行、戦闘、アイドル、エモートなど)から選んでベイクできます。出力形式はGLB(WebXR向け)、FBX(UnityやUnreal向け)、USDZ(Apple Vision Pro向け)など7種類です。

WebGLプロジェクトであればGLB形式が最適です。アニメーションがファイルに埋め込まれるため、Three.jsやBabylon.jsからそのまま読み���めます。

fal.aiでAPI連結する方法

fal.aiはGPT Image 2、FLUX.2 Klein、Meshy v6すべてを単一プラットフォーム上で提供しています。各モデルのAPIエンドポイントを順番に呼び出すだけで、パイプライン全体をコードで自動化できます。

基本的な流れはこうなります。

  1. openai/gpt-image-2(またはfal-ai/flux-2/klein/9b)で画像を生成し、URLを取得
  2. 取得した画像URLをMeshy v6のimage-to-3Dエンドポイントに渡す
  3. 生成された3DモデルにリギングAPIを適用
  4. アニメーション付きGLBをダウンロード

fal.aiのクライアントライブラリはPythonとJavaScript/TypeScriptに対応しています。サブスクリプション不要で、GPU秒単位の従量課金(H100で$1.89/時間、A100で$0.99/時間)またはモデル出力単位の課金です。

コストの目安

1キャラクターあたりの概算コストです。

  • 画像生成(GPT Image 2、Medium品質):$0.06
  • image-to-3D(Meshy v6、フルモード):30クレジット(Proプラン月額$20に含まれる)
  • リギング+アニメーション:Proプランの範囲内

画像生成だけAPIで外部に出し、3D変換はMeshyのProプラン内で処理する構成が現実的です。月額$20のProプランで月200クレジットが付与されるため、最低でも月6体以上のキャラクターを生成できます。

大量生産が必要な場合はMeshyのAPIプランを契約し、fal.ai経由でエンドツーエンドに自動化する方が効率的です。

制約と注意点

このパイプラインにはいくつかの限界があります。

背面の品質 — 1枚の画像からの3D変換では、見えない部分(背面や底面)をAIが推測します。キャラクターの背中のデザインが重要な場合は、複数アングルの画像を用意するか、生成後に手動で修正する必要があります。

アニメーションの汎用性 — プリセットアニメーションはMeshyが用意したモーションライブラリから選ぶ形式です。独自の動きが必要な場合は、Blenderなどで追加のアニメーションを作成してリターゲットする必要があります。

ライセンス — FLUX.2 Klein 9BはFLUX Non-Commercial Licenseのため、商用利用には別途契約が必要です。商用プロジェクトではGPT Image 2、またはFLUX.2 Klein 4B(Apache 2.0)を選んでください。Meshy v6はProプラン以上で商用利用可能です。

まとめにかえて

AI画像生成から3Dアセット制作までの距離は、2026年に入って急速に縮まっています。GPT Image 2の高精度な画像生成、FLUX.2 Kleinのリアルタイム推論、Meshy v6の高品質3D変換とオートリグ。これら���組み合わせることで、インディーゲーム開発者やWebXRクリエイターが少人数でキャラクターを量産で���る環境が整いました。

精度面ではまだプロのモデラーに及ばない場面もありますが、プロトタイピングやモブキャラクターの大量生成、WebGLデモの素材作りには十分実用的です。まずは1体、テキストから3Dキャラクターを生み出す体験を試してみてください。