GPT Image 2 × Midjourney sref スタイル探索ワークフロー解説

Midjourneyで見つけたスタイルを、GPT Image 2に引き継げる。

srefコードで生成した参照画像をGPT Image 2に渡すことで、Midjourneyが得意なスタイル発見力と、GPT Image 2が得意なテキスト描画精度を組み合わせられる。このワークフローを具体的な手順で解説する。

この記事でわかること：

Midjourney srefコードの仕組みと使い方
GPT Image 2の参照画像機能が何を変えるか
srefコードで生成した画像をGPT Image 2に渡す具体的な手順
このワークフローが特に効果を発揮するユースケース

Midjourney srefコードとは

https://docs.midjourney.com/hc/en-us/articles/32180011136653-Style-Reference

Midjourneyの --sref パラメータは、特定の画風や雰囲気を画像に適用するための機能だ。使い方には主に2種類ある。

1つ目は画像URLを渡す方法。参照したい画像のURLを --sref https://... の形式で指定すると、その画像の色調・質感・構図の雰囲気を取り込んで生成する。

2つ目が数値コード（srefコード）を渡す方法。--sref 66991795 のように数字を末尾に追加するだけで、Midjourney内部のスタイルライブラリから対応するビジュアルスタイルを呼び出せる。このコードは「srefコード」と呼ばれ、共有・再利用ができる。

srefコードはオンラインのライブラリ（srefcodes.com、promptsref.comなど）で多数公開されており、水彩画、ノワール映画、ポップアートといった多様なスタイルをコードで管理できる。--sref random を指定するとランダムなスタイルが適用されるため、偶然の発見も楽しめる。

srefコードの数字はユーザー間で共有可能で、同じコードを使えば誰でも同じスタイルを再現できる。この再現性がブランドスタイルの統一やクリエイター同士のスタイル共有を容易にしている。

GPT Image 2の参照画像機能

OpenAIが2026年4月21日にリリースした gpt-image-2（GPT Image 2）は、最大16枚の参照画像を入力として受け付け、そのスタイルや内容を反映した新しい画像を生成できる。前世代の gpt-image-1 からの主な強化点は3つある。

多言語テキスト描画の精度向上。日本語・中国語・韓国語を含む多言語テキストを画像内に正確に描写できる。看板、パッケージデザイン、インフォグラフィックなどテキストを含む制作物での利用に特に向いている。

生成前の推論パス。生成を始める前に内部で計画フェーズを実行する。複数の参照画像を渡した場合にスタイルの矛盾を解決し、一貫した出力を返す仕組みだ。

1K / 2K / 4K解像度への対応。出力サイズを用途に応じて選べる。SNS投稿には1K、商業印刷物には4Kという使い分けができる。

料金はトークンベースで、入力$8・生成$30（いずれも100万トークン換算）が公式価格だ（2026年4月時点）。1枚あたりの実コストは解像度と品質設定によって変動するため、OpenAIの料金計算ツールで事前に見積もることを勧める。

2つを組み合わせる理由

MidjourneyとGPT Image 2は得意領域が異なる。

Midjourneyはスタイルの発見と再現に強い。srefコードのライブラリを通じて独自の美的センスを持つスタイルを素早く見つけられる一方、テキスト描画の精度には限界があり、文字入りコンテンツの制作では不満が出ることが多い。

GPT Image 2は指示への追従精度とテキスト描画精度が高い。「このスタイルで、この文言を入れた画像を作れ」という要件に応えやすい。ただし、Midjourneyのような独自スタイル体系を持たないため、特定の画風を指定するための言語化が難しい場面がある。

srefコードで生成したMidjourney画像をGPT Image 2の参照画像として渡すことで、2つのモデルの欠点を補い合える。スタイルの発見・定義はMidjourneyに任せ、テキスト入りコンテンツの量産はGPT Image 2が担う形だ。

手順

ステップ1: srefコードでスタイル参照画像を生成する

MidjourneyのDiscordで以下のようなプロンプトを実行する。コンテンツの内容はシンプルにしておき、スタイルだけを際立たせるほうが後の参照として使いやすい。

simple illustration, white background --sref 66991795 --stylize 750

同じコードで複数のプロンプトを実行しておくと、次のステップで渡す参照画像のバリエーションが増え、GPT Image 2がスタイルをより正確に読み取りやすくなる。

ステップ2: 生成画像をGPT Image 2にアップロードする

ChatGPTのImages 2.0モード（またはOpenAI APIの gpt-image-2 モデル）を使い、ステップ1で生成した画像をアップロードする。スタイルが一貫している2〜4枚を選ぶのが目安だ。

APIを使う場合は image_url パラメータで画像を指定する。

ステップ3: 内容とスタイル継承の指示を添えてプロンプトを入力する

「生成してください」だけでなく、「参照画像のスタイル・色調・質感を維持しながら〇〇を生成してください」と明示する。スタイル継承の一文を添えることで出力の一貫性が上がる。

例：

参照画像のスタイルと色調を維持しながら、「期間限定セール」というテキストを含む
縦型バナー（1080×1920px）を生成してください。

特に有効なユースケース

多言語ブランドビジュアルの展開。Midjourneyで確立したブランドスタイルを、日本語・英語・中国語のパッケージデザインやバナーにGPT Image 2で展開できる。Midjourneyが苦手な多言語テキスト描画をGPT Image 2が補う形だ。

スタイル探索の加速。--sref random で偶然生まれたスタイルをキャプチャし、GPT Image 2で実際の制作物に適用するまでを素早く検証できる。アイデア段階でのスタイル比較検討に向く。

Midjourneyブレンドの応用。異なるsrefコードで生成した複数のスタイル参照画像をGPT Image 2に同時に渡すことで、スタイルのブレンド効果を試せる。参照画像の上限が16枚あるため、多様な組み合わせが可能だ。

注意点

このワークフローには2つのサービスへのアクセスが必要だ。Midjourneyは有料プラン（基本月10ドル程度）が前提で、GPT Image 2はChatGPT PlusプランまたはOpenAI API経由での利用となる。

GPT Image 2でスタイル継承を安定させるには、参照画像の質が重要になる。スタイルがばらついた画像を多数渡しても一貫した出力は得られない。同じsrefコードで生成した複数枚か、同じ画風の類似画像を揃えて渡すことを勧める。

GPT Image 2はMidjourneyと比べてプロンプトへの追従性が高い反面、偶発的なアート的解釈が少ない。意図した出力を正確に得る用途に強く、Midjourneyのような「予期せぬ発見」を楽しむ使い方には向かない。両者の特性を理解して使い分けるのが現実的だ。