AIで画像や動画を作るたびに、ブラウザを開いてモデルを選び直していませんか。

fal.aiが2026年5月7日に公開したgenmedia CLIは、ターミナルから1200超のAIモデルを検索・実行できるコマンドラインツールです。Claude CodeなどのAIエージェントとも統合でき、プロンプト1つで画像生成から動画出力まで自動化できます。

この記事でわかること:

  • genmedia CLIが解決する課題と概要
  • インストールから初回セットアップまでの手順
  • modelsrunstatus など主要コマンドの使い方
  • Claude Codeと連携してAIに生成を任せるスキル機能
  • 非同期ワークフローで長時間生成を扱う方法

ブラウザ操作をコマンド1行に置き換える

fal.aiはFLUX・Kling・Hailuo・Veoなど1200以上のモデルを提供する生成AI APIプラットフォームです。これまでモデルを試すにはWebのPlaygroundかAPIクライアントのコードを書く必要がありました。

genmedia CLIはその手順を省略します。ターミナルから直接モデルを検索し、パラメータを渡して実行し、生成物をローカルに保存できます。TTY(対話端末)では見やすい表示、パイプやスクリプト内では構造化JSONを返すため、人間にも自動化スクリプトにも同じコマンドが使えます。MCPサーバーのセットアップも不要です。

インストールと初期設定

macOS・Linuxはcurlで1行インストールできます。

curl https://genmedia.sh/install -fsS | bash

WindowsはPowerShellから実行します。

irm https://genmedia.sh/install.ps1 | iex

インストール後、対話式のセットアップウィザードを起動します。

genmedia setup

ウィザードではAPIキーの保存・出力モード(auto / json / standard)・自動アップデートの有効化を設定します。APIキーはfal.ai/dashboard/keysで発行できます。環境変数で渡す場合は FAL_KEY に設定するだけで動作します。

CI環境やエージェントで非対話セットアップをする場合は次のように書けます。

genmedia setup --non-interactive --api-key "$FAL_KEY"

主要コマンドの使い方

モデルを探す — models

キーワードやカテゴリでモデルを検索します。

genmedia models "text to video"
genmedia models "flux" --category text-to-image
genmedia models --category text-to-speech --limit 5

カテゴリは text-to-image・image-to-image・text-to-video・image-to-video・video-to-video・text-to-3d・image-to-3d・text-to-audio・audio-to-text・image-to-text の10種類に対応しています。特定のエンドポイントのOpenAPIスキーマを確認したい場合は --expand openapi-3.0 を追加します。

スキーマを確認する — schema

モデルが受け付けるパラメータ一覧を確認します。

genmedia schema fal-ai/flux/dev

モデルを実行する — run

genmedia run fal-ai/flux/dev --prompt "a cat on the moon"

モデルのパラメータは --フラグ名 値 の形式で渡せます。使えるフラグは --help で確認できます。

genmedia run fal-ai/flux/dev --help

生成物をローカルに保存するには --download を追加します。出力先のパスやファイル名テンプレートも指定できます。

genmedia run fal-ai/flux/dev --prompt "a cat" --download "./out/{index}.{ext}"

動画生成など処理に時間がかかるモデルは --async で非同期実行できます。

genmedia run fal-ai/veo3.1 --prompt "a dog running" --async

非同期実行すると request_id が返るので、status コマンドで進捗を確認します。

非同期ジョブを管理する — status

genmedia status fal-ai/veo3.1 <request_id>
genmedia status fal-ai/veo3.1 <request_id> --result
genmedia status fal-ai/veo3.1 <request_id> --download ./out/

--cancel でキューのジョブをキャンセルすることもできます。

ファイルをアップロードする — upload

image-to-imageやimage-to-videoのように入力に画像URLが必要なモデルには、ローカルファイルをfal CDNにアップロードしてURLを取得できます。

genmedia upload ./photo.jpg

ローカルパスでも外部URLでも受け付けます。

料金を確認する — pricing

genmedia pricing fal-ai/flux/dev

モデルによって従量課金の単価が異なるため、実行前に確認しておくと安心です。

Claude Codeと連携するスキル機能

genmedia CLIの特徴の1つが、AIエージェントと連携するスキル(Skills)システムです。

スキルは SKILL.md を持つフォルダ単位の知識ファイルで、Claude Code・Claude.ai Projectsなどのエージェントプラットフォームが読み込めます。fal公式リポジトリfal-ai-community/skillsには、cinematography(映像演出)・character-design(キャラクターデザイン)・commercial(商品撮影)・storytelling(シーケンス制作)など本番向けスキルが揃っています。

genmedia init

このコマンドを実行すると、デフォルトのスキルバンドルが .agents/skills/ または .claude/skills/ にインストールされます。Claude Codeのプロジェクトで設定すると、自然言語の指示からgenmediaコマンドを生成・実行する一連のワークフローをClaudeに任せられます。

Claude.aiのプロジェクト機能を使う場合は、skills/ 以下のスキルフォルダをZIPにしてアップロードするだけです。

主な対応モデル

genmedia CLIで実行できる代表的なモデルを挙げます。

  • 画像生成: FLUX(dev / schnell)、GPT Image 2、Ideogram
  • 動画生成: Kling 3.0、Veo 3.1、Hailuo、Happy Horse 1.0
  • 3D生成: Meshy
  • 音声: Suno

1200超のエンドポイントすべては genmedia models で検索できます。

MCP不要で既存ワークフローに組み込みやすい

MCPサーバーの場合、各ツールとの接続設定や再起動が必要です。genmedia CLIはシェルコマンドとして動くため、既存のbashスクリプト・Makefile・CI/CDパイプラインにそのまま追加できます。

また、TTYとパイプで出力形式が自動切り替わるため、人が手元で試しながら、同じコマンドをスクリプトでも使えます。

genmedia CLIはv0.6.1時点でMITライセンスで公開されており、デフォルトで匿名の使用統計がPostHogへ送信されます。オプトアウトは環境変数 GENMEDIA_NO_ANALYTICS=1 で設定できます。

まとめ

genmedia CLIは、fal.aiが公開したAI生成メディアのためのコマンドラインツールです。1200超のモデルをターミナルから検索・実行でき、Claude CodeなどのAIエージェントとスキル連携することで生成ワークフローを自動化できます。ブラウザやAPIクライアントコードを書かずに画像・動画生成を試したい開発者・クリエイターに向いています。