AIが食材の味を知っている——そう聞くと、にわかには信じがたい話です。しかし、ロンドンのフードAIスタートアップKAIKAKU.AIが発表した論文「Epicure」は、100万件以上のレシピで学習した食材埋め込みに、辛さ・甘さ・旨味・食感・文化圏まで15の味覚次元が隠れていたことを明らかにしました。

この記事でわかること:

  • スコヴィル値を教えていないAIが唐辛子の辛さ順を当てた仕組み
  • FlavorGraphの食材埋め込みとLLMデータキュレーションの役割
  • 発見された15の味覚次元の中身
  • 実際に使えるツール「Epicure Flavour Explorer」の概要

FlavorGraphとは

https://github.com/lamypark/FlavorGraph

FlavorGraphは、2021年にParkらが発表した食材のグラフ埋め込みモデルです。100万件以上のレシピの共起データと、1,561種類の香味化合物の化学構造を組み合わせて学習されています。約6,653種類の食材がそれぞれ300次元のベクトルで表現されており、化学的な親和性とレシピ上の組み合わせパターンの両方を捉えています。

ただし、元データにはアルミホイルやプラスチックカップなど食材でないものが混在し、「チェダーチーズ」が複数の表記で別々のノードになっているなど、データ品質に大きな課題がありました。Epicureはこの問題に正面から取り組んでいます。

Epicureが行ったこと

https://arxiv.org/abs/2604.22776

KAIKAKU.AIのJakub RadzikowskiとJosef Chenが2026年4月に発表したEpicureは、FlavorGraphのデータを整理し、隠れた構造を引き出すためのLLMデータキュレーションパイプラインです。

具体的には、Google Gemini 2.5 Flashを使って6,653件の生データを1,032件の正規化エントリに統合しました。食材でないものの除去、表記ゆれの統合、カテゴリ分類、埋め込みベクトルの平均化を段階的に実行しています。人手によるチェックも組み込まれており、完全自動ではありません。

整理後のデータを分析した結果、FlavorGraphの埋め込みには少なくとも15の独立した次元が存在していたことが判明しました。

辛さの序列を当てたAI

15次元のうち、最も強い相関を示したのがスコヴィル値(辛さの指標)です。スピアマン相関係数ρ=0.76という高い値を記録しました。

注目すべきは、FlavorGraphの学習データにスコヴィル値の情報は一切含まれていない点です。AIは唐辛子の辛さランキングを教えられたことがありません。それにもかかわらず、ピーマンからハバネロまでの辛さの序列を高い精度で再現しています。レシピの中で「どの食材と一緒に使われるか」というパターンだけで、辛さの概念を獲得していたことになります。

15の味覚次元の全体像

発見された次元は、検証方法によって2つのグループに分かれます。

序列の相関が確認された7次元

スピアマン相関係数ρ=0.37〜0.76の範囲で、連続的な序列との相関が確認されました。スコヴィル値のほか、気候帯の緯度、五味(甘味・塩味・旨味・酸味・苦味)、NOVA食品加工レベル(食品がどの程度加工されているかを4段階で示す国際的な分類基準)が含まれます。

二値分類で有意差が出た7次元

Cohen’s d=0.79〜1.26の効果量で、「ある/なし」の二値分類が成功しています。酸味、苦味、硬さ、水分量、脂肪分などが該当します。

さらに、7つのマクロ地域(東アジア、南アジア、地中海など)による文化圏クラスタリングも確認されています。kNN純度は0.43で、ランダムベースラインの6.2倍でした。データキュレーション後にこの純度はほぼ2倍に向上しています。

甘さはレシピの共起だけで生まれていた

特に注目すべき発見があります。甘味と塩味がどこから来ているか、という問題です。

FlavorGraphの学習データには、砂糖(スクロース)やナトリウムの化学構造情報が含まれていません。つまり、甘味と塩味の次元は化学的な経路からではなく、レシピ上での食材の共起パターンだけから自然に獲得されていたことになります。砂糖を多く使う食材同士はレシピで一緒に登場しやすく、そのパターンが埋め込み空間上で「甘さの軸」として結晶化したわけです。

一方、旨味・タンパク質・脂肪には化学的な経路(グルタミン酸などの化合物情報)とレシピ共起の両方が寄与していることも、化合物ノードを除去する実験で明らかになっています。

USDA実験データによる裏付け

これらの結果が、LLMによるラベリングの偏りではないことを示す検証も行われています。USDA FoodData Central(米国農務省の食品成分データベース)の実験室測定データと、712件の食材を突き合わせた結果です。

タンパク質(ρ=0.47)、炭水化物(ρ=0.47)、カロリー(ρ=0.47)、食物繊維(ρ=0.44)、脂肪(ρ=0.44)の5つの栄養素次元で有意な相関が確認されました。糖分と甘味(ρ=0.41)、グルタミン酸と旨味(ρ=0.24)の対応も実験データで裏付けられています。LLMが介在しない外部データでも同じ構造が再現された点は、発見の信頼性を支えています。

Epicure Flavour Explorer

https://epicure.kaikaku.ai

KAIKAKU.AIは研究成果を実用ツールとして公開しています。Epicure Flavour Explorerは、整理されたFlavorGraphデータをもとに食材ペアリングを提案し、AIがレシピを自動生成するWebアプリケーションです。

食材を選ぶと、化学的な相性とレシピデータに基づいた推奨ペアリングが表示されます。レシピは文化的な文脈も加味されており、難易度別に複数のバリエーションが生成されます。画像生成にはGoogle Imagenが使われています。埋め込みデータの3D可視化ツールも公開されており、1,032件の食材が空間上でどのように分布しているかを回転・ズームしながら探索できます。

まとめ

食品業界のAI活用は、これまでレシピ推薦や栄養計算が中心でした。Epicureが示したのは、その先にある可能性です。モデルを新たに作り直すのではなく、既存の学習済み埋め込みをデータキュレーションで磨くことで新しい価値を引き出せるという知見は、食品に限らず他の分野にも応用が利きます。「データ中心AI」の考え方が、味の世界でも有効であることを具体的に証明した研究です。