YouTubeのサムネイルは、クリック率を左右する重要な要素です。一方で、参考画像の収集、レイアウト検討、新案の生成を別ツールで行うと、試行のたびに画面を切り替える手間が積み重なります。

クリエイター向けのRiley Brown氏は、Codex内でPaperを使い、YouTubeや任意のサイトからサムネイルをボードへ取り込み、GPT Image 2でコンセプトを素早く試せると報告しています(元投稿)。この記事では、そのワークフローの仕組みと、再現のための前提条件を整理します。

この記事でわかること

  • PaperとCodexをMCPでつなぐと何ができるか
  • YouTubeサムネイルをボード上の要素として扱う流れ
  • 組み込みのGPT Image 2(gpt-image-2)が担う役割
  • 再現時に押さえるべきセットアップと注意点

課題は「参考収集」と「生成」が分断されること

サムネイル制作では、次の3段階を繰り返します。

  1. 競合や過去動画のサムネを参考として集める
  2. レイアウトやトーンの案を並べて比較する
  3. 新しいビジュアルを生成し、微調整する

従来は、ブラウザで画像を保存し、デザインツールに貼り、別途画像生成AIを開く、という分断が起きがちです。Brown氏が強調しているのは、Codexのスレッド内でPaperのボードに画像を並べ、同じ環境でGPT Image 2まで回せる点です。各画像が独立した要素として扱えるため、配置を変えながらコンセプト探索が進みます。

PaperとCodexの連携の仕組み

Paperは、HTMLとCSSを基盤にしたデザインキャンバスです。Figmaのようにビジュアルで編集しつつ、Web標準に沿った出力が得られるのが特徴です。公式サイトでは、CodexやCursor、Claude CodeなどのエージェントをMCP(Model Context Protocol)経由でキャンバスに接続できると説明されています。

Codexとの接続は、Paper Desktopアプリを起動したうえで、MCPサーバーを登録します。公式ドキュメントでは、プラグイン方式(paper-design/agent-pluginsマーケットプレイスからpaper-desktopを導入)と、手動設定(Streamable HTTPでhttp://127.0.0.1:29979/mcp)の両方が案内されています(Paper MCPドキュメント)。接続が成功すると、エージェントはキャンバスの読み取り・書き込み・スクリーンショット取得などのツールを使えます。

Brown氏の投稿で「Paper inside Codex」と表現されているのは、このMCP連携により、Codexの会話からPaper上のボードを直接操作できる状態を指します。デザイン作業をCodexの外に出さず、エージェントが参照画像の配置や生成結果の反映まで担えるのが要点です。

YouTubeサムネイルをボードに並べる流れ

Brown氏は、自作の「YouTube thumbnail skill」を併用していると述べています。Codexのスキルは、再利用可能な手順書(SOP)のようなもので、プラグイン配下のskillsフォルダに置かれ、スラッシュコマンドで呼び出せます。彼の動画解説では、YouTubeから他クリエイターのサムネイルを取得し、自分の写真などを「要素(elements)」としてアプリ内に蓄え、スタイル参考にしながら新案を生成する流れが紹介されています(参考動画)。

今回のX投稿で触れられているのは、その延長線上の使い方です。

  • YouTubeや任意のサイトからサムネイル画像を取得する
  • Paperのボード上に配置し、要素として扱う
  • 配置を変えながらコンセプトを比較検討する

Web検索だけでなく、元投稿本文では「任意のサイト(any site)」とも書かれており、YouTubeに限定されません。ブログのヒーロー画像やSNSバナーのリサーチにも転用しやすい構成です。

GPT Image 2が担う生成部分

Codexには、スレッド内で画像を生成・編集する機能が組み込まれています。公式のCodexアプリ機能ドキュメントでは、UIアセットやバナー、イラストの作成に使え、参照画像を渡して変換や拡張も可能とされています。組み込みの画像生成はgpt-image-2モデルを使用し、プロンプトに$imagegenを含めると画像生成スキルを明示的に呼び出せます。

OpenAIは2026年4月21日、gpt-image-2をAPIとCodexで利用可能にしたと発表しています(開発者コミュニティの告知)。レイアウト、テキスト描画、編集の指示追従が強化され、インフォグラフィックやポスターなど文字の多いビジュアルにも向くと説明されています。Codex上の利用は、Codexの利用枠にカウントされ、画像生成ありのターンは平均で3〜5倍速く枠を消費する場合があると公式に記載されています。

Brown氏のワークフローでは、ボード上の参考サムネ(要素)を文脈にしつつ、組み込みのGPT Image 2で新案を出す、という二層構造になっています。参考の配置と生成が同じPaperボード上で完結するため、「参考を見ながら何度も試す」サイクルが短くなります。

再現のためのセットアップ手順

このワークフローを試す場合、次の順で準備します。

  1. Codexアプリをインストールし、ChatGPTの有料プラン(Plus以上)でCodexが使える状態にする
  2. Paper Desktopをインストールし、デザインファイルを開いてMCPサーバーを起動する
  3. CodexでPaper MCP(プラグインまたは手動URL登録)を接続する
  4. 必要ならYouTube thumbnail skillのようなカスタムスキルを作成し、サムネ取得手順を定型化する

接続確認は、Codexの新規スレッドで「Paperに赤い四角を作って」と依頼し、キャンバスに反映されるかで行えます。Paperのドキュメントでは、接続トラブル時はエージェントセッションの再起動が第一の対処とされています。

画像のドラッグ&ドロップもCodex側でサポートされています。Shiftを押しながらドロップすると、プロンプトのコンテキストに画像を追加できます。参考画像を手動で渡す場合の補助手段になります。

活用例と向いている用途

Brown氏の例に限らず、次の用途に転用しやすい構成です。

  • YouTubeサムネイル:過去動画や競合チャンネルのサムネをボードに並べ、トーンを揃えた新案を生成する
  • SNS・ブログのビジュアル:記事や投稿の参考画像を集め、レイアウト案を素早く比較する
  • プロダクトUIのコンセプト:モックアップや競合画面を要素として配置し、バリエーションを試す

PaperはFigmaのMCPと併用してデザイントークンを同期する手順も公式に用意されており、既存のFigma資産があるチームは、Paperへスタイルを移してからCodexで編集する道も取れます。

注意点と限界

まず、Paper MCPはPaper Desktopアプリの起動が前提です。ブラウザ版だけではMCPサーバーが動かないため、デスクトップアプリのインストールが必要です。

次に、利用枠とコストです。Codex内のgpt-image-2はCodexの利用制限に含まれ、大量生成時は環境変数OPENAI_API_KEYを設定してAPI経由に切り替える方法が公式に案内されています。Brown氏のような高頻度のサムネ試行では、枠の消費ペースを確認しておくと安心です。

第三に、再現性です。Brown氏の「YouTube thumbnail skill」は個人がCodex上に構築したスキルであり、標準機能として同梱されているわけではありません。サムネ取得や要素管理のロジックは、自分用にスキル化する必要があります。

最後に、事実の出所です。本記事の中核となるワークフロー説明は、2026年6月2日のX投稿と、Paper・Codexの公式ドキュメント、Brown氏の公開動画に基づいています。OpenAIとPaperの連携は急速に更新される領域のため、プラグイン名やMCPのURLは利用時点の公式ドキュメントで再確認してください。

CodexとPaperをMCPでつなぎ、参考画像をボードの要素として並べ、GPT Image 2で新案を出す——この3点が揃うと、ビジュアルリサーチとコンセプト探索を一つのデスクトップ環境に集約できます。サムネイル制作に限らず、参考を見ながら素早く案を試したいクリエイターや開発者にとって、試す価値のある構成です。