肺がん手術リスクをAI予測 MIRACLEの仕組みと81%の精度

肺がんの外科手術では、術後合併症の発生率が最大40%に達する。既存のリスク予測ツールは患者個々の複雑さに対応できず、経験豊富な外科医でも正確な判断は難しい。

米バッファロー大学とロズウェルパーク総合がんセンターの研究チームが開発したAIシステム「MIRACLE」は、その課題を「臨床データ・CT画像・LLMの説明文」を統合することで解決しようとしている。2026年1月にarXivに論文が公開され、3月にはWACV 2026（コンピュータビジョン国際会議）でも発表された。

この記事でわかること：

既存の術前リスク計算ツールが抱える限界
MIRACLEが複数のデータを組み合わせる仕組み
外科医が編集できるリスク要約を生成する理由
3,094件の患者データで検証した精度の数値
臨床実装に向けた今後の課題

https://arxiv.org/abs/2601.14154

既存ツールが個別リスクを捉えられない理由

現在使われている術前リスク計算ツールは、集団レベルの統計から導いた指標に基づいている。年齢・喫煙歴・肺機能といった基本情報は考慮されるが、患者が持つ複数の併存疾患、CTで捉えられる微細な解剖学的特徴、外科医が臨床現場で感じ取る「フレイル（虚弱）」などは反映されない。

ロズウェルパークの胸部外科医Kenneth Seasteadt医師はこの問題を指摘する。「既存の計算ツールは非常に汎用的で、実際に診ている患者の複雑さを捉えられていない。安全に手術できる患者を見逃したり、リスクが高い患者への準備が不十分になったりする」。

実際の数字にも表れている。研究で使用したデータセットでは、熟練の胸部外科医が術後合併症を正確に特定できた割合は約45%にとどまった。

3種類のデータをひとつのモデルで扱う

MIRACLE（Multimodal Integrated Radiomics and Clinical Language-based Explanation）は、術前に取得できる3種類のデータを統合して個別リスクを算出する。

臨床情報（年齢、喫煙歴、肺機能検査の値、他疾患の有無）は患者の基本的な状態を表す。CT画像から抽出した放射線学的特徴（ラジオミクス）は、腫瘍や肺の構造を数値化したもので、目視では見落とされやすい高次元の情報を含む。これに加え、胸部外科の文献と臨床ガイドラインに基づいてLLMがリスク因子を自然言語で説明した要約文が、第3の入力として機能する。

異なる形式のデータを統合するために、「超球面埋め込み空間（hyperspherical embedding space）」という手法を採用している。構造化されたテーブルデータと高次元の画像データを同じ特徴空間で扱えるよう変換し、両者から頑健な特徴を抽出する。この設計により、単一データソースを使うモデルよりも精度の高い予測が可能になる。

外科医が要約を編集できる設計の意図

MIRACLEの特徴的な機能として、AIが出力するリスク要因の要約を外科医が直接編集できる仕組みがある。

データには記録されていない「患者の歩行状態が悪化している」などの観察所見を要約に加えると、AIはその情報をもとにリスク推定値を再計算する。データが捉えきれないニュアンスも意思決定に組み込める点が、臨床現場での受け入れやすさにつながる。

幻覚（ハルシネーション）への対策も施されている。年齢・性別・BMIなどの主要な臨床因子はロックされており、LLMが書き換えることはできない。また、臨床データはセッション中にのみ処理され、終了後は即座に削除されるため、HIPAA（米国医療情報プライバシー法）への準拠も考慮されている。

3,094件の実データで検証した精度

研究チームは、2009年から2023年の間にロズウェルパークで手術を受けた肺がん患者3,094件のデータを用いて検証を行った。

MIRACLEは5種の機械学習モデル、3種のオープンソースLLM単体、そして現場の胸部外科医（正答率約45%）を上回る結果を示した。最も精度が高かった構成では、合併症リスクの高低を区別する精度が約81%に達し、感度は75〜80%を記録した。

外科医のパネルがAIの出力を評価したところ、多くの説明が自身の臨床推論と一致していたと報告された。一方で、複数の併存疾患が絡み合うケースではリスクを過大評価する傾向もあり、最終判断には臨床医の解釈が引き続き必要だと指摘された。

今後の課題と展開

次のステップは、ロズウェルパークでのリアルタイム前向き検証（プロスペクティブ・バリデーション）だ。過去データで訓練されたモデルが実際の臨床現場でも機能するかを確認し、高リスク患者の特定に役立てることを目指している。

検証が成功すれば、他の外科専門分野への応用も視野に入る。AIがリスク要因を説明し医師が修正できるという「介入可能（intervenable）」な設計は、医師がシステムの推論を理解して信頼するうえで重要な要素になる。データを持つ医療機関とAI技術を持つ大学の連携が、患者中心の意思決定支援ツールを生む好例といえる。