AIで画像や動画を作るたびに、ブラウザを開いてモデルを選び直していませんか。
fal.aiが2026年5月7日に公開したgenmedia CLIは、ターミナルから1200超のAIモデルを検索・実行できるコマンドラインツールです。Claude CodeなどのAIエージェントとも統合でき、プロンプト1つで画像生成から動画出力まで自動化できます。
この記事でわかること:
- genmedia CLIが解決する課題と概要
- インストールから初回セットアップまでの手順
models・run・statusなど主要コマンドの使い方- Claude Codeと連携してAIに生成を任せるスキル機能
- 非同期ワークフローで長時間生成を扱う方法
ブラウザ操作をコマンド1行に置き換える
fal.aiはFLUX・Kling・Hailuo・Veoなど1200以上のモデルを提供する生成AI APIプラットフォームです。これまでモデルを試すにはWebのPlaygroundかAPIクライアントのコードを書く必要がありました。
genmedia CLIはその手順を省略します。ターミナルから直接モデルを検索し、パラメータを渡して実行し、生成物をローカルに保存できます。TTY(対話端末)では見やすい表示、パイプやスクリプト内では構造化JSONを返すため、人間にも自動化スクリプトにも同じコマンドが使えます。MCPサーバーのセットアップも不要です。
インストールと初期設定
macOS・Linuxはcurlで1行インストールできます。
curl https://genmedia.sh/install -fsS | bash
WindowsはPowerShellから実行します。
irm https://genmedia.sh/install.ps1 | iex
インストール後、対話式のセットアップウィザードを起動します。
genmedia setup
ウィザードではAPIキーの保存・出力モード(auto / json / standard)・自動アップデートの有効化を設定します。APIキーはfal.ai/dashboard/keysで発行できます。環境変数で渡す場合は FAL_KEY に設定するだけで動作します。
CI環境やエージェントで非対話セットアップをする場合は次のように書けます。
genmedia setup --non-interactive --api-key "$FAL_KEY"
主要コマンドの使い方
モデルを探す — models
キーワードやカテゴリでモデルを検索します。
genmedia models "text to video"
genmedia models "flux" --category text-to-image
genmedia models --category text-to-speech --limit 5
カテゴリは text-to-image・image-to-image・text-to-video・image-to-video・video-to-video・text-to-3d・image-to-3d・text-to-audio・audio-to-text・image-to-text の10種類に対応しています。特定のエンドポイントのOpenAPIスキーマを確認したい場合は --expand openapi-3.0 を追加します。
スキーマを確認する — schema
モデルが受け付けるパラメータ一覧を確認します。
genmedia schema fal-ai/flux/dev
モデルを実行する — run
genmedia run fal-ai/flux/dev --prompt "a cat on the moon"
モデルのパラメータは --フラグ名 値 の形式で渡せます。使えるフラグは --help で確認できます。
genmedia run fal-ai/flux/dev --help
生成物をローカルに保存するには --download を追加します。出力先のパスやファイル名テンプレートも指定できます。
genmedia run fal-ai/flux/dev --prompt "a cat" --download "./out/{index}.{ext}"
動画生成など処理に時間がかかるモデルは --async で非同期実行できます。
genmedia run fal-ai/veo3.1 --prompt "a dog running" --async
非同期実行すると request_id が返るので、status コマンドで進捗を確認します。
非同期ジョブを管理する — status
genmedia status fal-ai/veo3.1 <request_id>
genmedia status fal-ai/veo3.1 <request_id> --result
genmedia status fal-ai/veo3.1 <request_id> --download ./out/
--cancel でキューのジョブをキャンセルすることもできます。
ファイルをアップロードする — upload
image-to-imageやimage-to-videoのように入力に画像URLが必要なモデルには、ローカルファイルをfal CDNにアップロードしてURLを取得できます。
genmedia upload ./photo.jpg
ローカルパスでも外部URLでも受け付けます。
料金を確認する — pricing
genmedia pricing fal-ai/flux/dev
モデルによって従量課金の単価が異なるため、実行前に確認しておくと安心です。
Claude Codeと連携するスキル機能
genmedia CLIの特徴の1つが、AIエージェントと連携するスキル(Skills)システムです。
スキルは SKILL.md を持つフォルダ単位の知識ファイルで、Claude Code・Claude.ai Projectsなどのエージェントプラットフォームが読み込めます。fal公式リポジトリfal-ai-community/skillsには、cinematography(映像演出)・character-design(キャラクターデザイン)・commercial(商品撮影)・storytelling(シーケンス制作)など本番向けスキルが揃っています。
genmedia init
このコマンドを実行すると、デフォルトのスキルバンドルが .agents/skills/ または .claude/skills/ にインストールされます。Claude Codeのプロジェクトで設定すると、自然言語の指示からgenmediaコマンドを生成・実行する一連のワークフローをClaudeに任せられます。
Claude.aiのプロジェクト機能を使う場合は、skills/ 以下のスキルフォルダをZIPにしてアップロードするだけです。
主な対応モデル
genmedia CLIで実行できる代表的なモデルを挙げます。
- 画像生成: FLUX(dev / schnell)、GPT Image 2、Ideogram
- 動画生成: Kling 3.0、Veo 3.1、Hailuo、Happy Horse 1.0
- 3D生成: Meshy
- 音声: Suno
1200超のエンドポイントすべては genmedia models で検索できます。
MCP不要で既存ワークフローに組み込みやすい
MCPサーバーの場合、各ツールとの接続設定や再起動が必要です。genmedia CLIはシェルコマンドとして動くため、既存のbashスクリプト・Makefile・CI/CDパイプラインにそのまま追加できます。
また、TTYとパイプで出力形式が自動切り替わるため、人が手元で試しながら、同じコマンドをスクリプトでも使えます。
genmedia CLIはv0.6.1時点でMITライセンスで公開されており、デフォルトで匿名の使用統計がPostHogへ送信されます。オプトアウトは環境変数 GENMEDIA_NO_ANALYTICS=1 で設定できます。
まとめ
genmedia CLIは、fal.aiが公開したAI生成メディアのためのコマンドラインツールです。1200超のモデルをターミナルから検索・実行でき、Claude CodeなどのAIエージェントとスキル連携することで生成ワークフローを自動化できます。ブラウザやAPIクライアントコードを書かずに画像・動画生成を試したい開発者・クリエイターに向いています。
