Digital Twins of Ex Vivo Human Lungs Enable Accurate and Personalized Evaluation of Therapeutic Efficacy

著者: Xuanzi Zhou, Bo Wang, Yiyang Wei, Serena Hacker, Sumin Kim, Thomas Borrillo, Abby McCaig, Haaniya Ahmed, Youxue Ren, Olivia Hough, Luca Orsini, Bonnie T. Chao, Micheal McInnis, Marcelo Cypel, Mingyao Liu, Jonathan C. Yeung, Lorenzo Del Sorbo, Shaf Keshavjee, Andrew T. Sage
Corresponding author: Shaf Keshavjee, Andrew T. Sage (University Health Network, Toronto)
雑誌: Nature Biotechnology
発行年: 2026
Epub日: N/A
Article種別: Original Article
PMID: 42082790

背景

デジタルツイン (DT; digital twin) は、物理的対象物の包括的なコンピュータ表現であり、工学分野ではエンジンや自動車の研究開発を加速する手法として確立されている。しかし、医療分野においては、細胞レベルから臨床データまでを統合した高忠実度・多スケールのDTは未実現であった。既存の医療DTは疾患予後モデルの延長に過ぎず、真のデジタルツインが体現すべき包括的・多モーダルな性質を十分に反映していないとされてきた。特に、大規模かつ多モーダルなデータセットの不足が、医療における包括的なDTの実現を妨げる主要な課題であった。この領域には依然として大きな知識ギャップが残されている。

Ex vivo lung perfusion (EVLP; 体外肺灌流) は、摘出されたヒト肺を37℃の生理的条件下で体外灌流しながら、集中治療室 (ICU; intensive care unit) グレードの人工呼吸器を用いて肺機能を評価するシステムである。EVLPは臓器移植の適否判断に用いられる一方で、生理的モニタリング、画像、分子プロファイリングにわたる豊富な多モーダルデータを連続的に生成できるため、高忠実度DT構築に理想的なプラットフォームを提供する。Toronto大学のUniversity Health Network (UHN; 医療・研究機関ネットワーク) は2008年以来1,000例超の臨床EVLPを実施しており、世界最大規模のデータベースを保有している。

EVLPは自己完結した閉鎖回路であり、組織・灌流液のサンプリング、高解像度センサーによる連続測定 (10 ms間隔)、X線撮影を組み合わせた多スケールデータを取得できる。このデータの多様性—ゲノム・分子プロファイリングから生理センサー計測・医用画像まで—が、物理法則ベースモデルとデータ駆動型機械学習 (ML; machine learning) を組み合わせたハイブリッドDTの基盤を提供する。EVLPを用いることで、DT研究で常に問題となる包括的多モーダルデータセットの欠如を克服できると著者らは着想した。しかし、先行研究である Sun et al. (2023) や De Domenico et al. (2025) などの既報では、単一のモダリティに限定された物理ベースまたはデータ駆動型モデルが主流であり、包括的なハイブリッドDTの構築は未開拓の領域であった。医療DTの分野では、生理機能やマルチオミクスを含む多次元パラメータを高精度に予測するシステムが不足しており、個体間変動を克服して治療効果を正確に評価する手法が未確立であるという課題が残されていた。

目的

本研究の目的は、ex vivo肺灌流 (EVLP) から得られた世界最大規模の多モーダルデータセットを用いてヒト肺のデジタルツイン (DT) を構築し、以下の2点を実証することである。(1) 生理機能、生化学、オミクス、画像を含む75項目以上の肺パラメータを高精度で予測する能力、および (2) 薬剤治療効果の個別化評価ツールとしての有用性。特に、従来の小集団対照群設計と比較して、DTによる仮想対照を用いることで、必要症例数の削減と統計効率の向上を示すことを目標とした。これにより、個別化された治療評価と創薬研究の加速に貢献する可能性を検証する。本研究は、従来の対照群設計が抱える症例数確保の課題と、個体間変動による治療効果評価の困難さを克服することを目指す。

結果

生理・生化学パラメータの高精度予測: DTは13の生理指標をいずれも高精度で予測した (Table 1)。気道圧はMAPE (mean absolute percentage error) 2.4〜8.0%、肺コンプライアンスはMAPE 6.2〜13%、動脈O₂分圧はMAPE 5.5〜8.1%、静脈CO₂分圧はMAPE 6.3〜8.0%と、全てで平均誤差は2〜13%の範囲に収まった。電解質・酸塩基指標7項目でもMAPE 0.46〜13%と高精度を達成した。動的DTは静的DTと同等またはより良好な精度を示し、特に酸塩基系で顕著な向上が得られた (pH MAPE: 静的0.85% vs 動的0.46%; 重炭酸塩MAPE: 静的13% vs 動的7.2%; 塩基過剰MAPE: 静的5.5% vs 動的2.7%)。One-sample t検定による系統的バイアス検定でも有意な偏りは認められなかった。さらにDTの予測誤差は、n=5 donors の経験的対照群における変動係数 (%CV) を全パラメータで一貫して下回り (Extended Data Table 5)、従来の小集団対照を超える精度と再現性を実証した。例えば、平均気道圧のMAPEは静的DTで3.9%、動的DTで2.4%であったのに対し、経験的対照群の%CVは14±26%であった。

オミクスパラメータの予測: メタボロミクスではグルコース (MAPE 動的4.9% vs 静的10%) と乳酸 (MAPE 動的6.9% vs 静的13%) を高精度で予測した (Table 2)。トランスクリプトミクスでは低酸素 (MAPE 0.83%)、p53シグナリング (0.96%)、TGFβシグナリング (0.73%)、TNF-α/NF-κB経路 (2.2%)、炎症反応 (3.3%) など10の肺疾患関連遺伝子セット濃縮スコアをMAPE 0.68〜3.3%で予測した (Table 2)。特に低酸素経路の変化方向の予測精度は100%に達した。プロテオミクスでは動的DTがIL-10を中央値MAPE 23%、IL-1β 26%、IL-6 22%、IL-8 37%で予測した (Table 2)。MAPE値は極端な濃度範囲のため平均値が外れ値に引っ張られる傾向があったが、中央値MAPEは他のパラメータの予測精度とより一致していた。これらは、従来の細胞実験 (n=3 replicates) における遺伝子発現変動の 2.5-fold increase や、炎症性サイトカインの log2FC 1.8 といった大きな変動幅に対しても、極めて頑健な予測性能を維持できることを示している。

画像パラメータの予測: EVLP時のX線画像からResNet-50で抽出した上位10主成分 (PC; principal component) をDTが予測した。DT予測のPC値は放射線学的所見と有意に相関した (Table 3): 浸潤影 r=0.65 (p=1.33×10⁻¹⁴)、浸潤 r=0.66 (p=1.87×10⁻¹⁴)、肺炎 r=0.51〜0.56 (p<10⁻⁸)。EVLPプラットフォームでは心臓・胸壁の遮蔽がなく、より純粋な肺野評価が可能な点が通常の胸部X線との差異として強調された。

独立コホートによるバリデーション: 独立テストコホートn=45 donors でのMAE・MAPEはk-fold交差検証での訓練データOOF予測と一致しており、DTの汎化性能と較正の質が確認された。シミュレーションコホートn=50 donors でも性能指標は訓練時と一致した。DT予測値と実測値の平均誤差がゼロから有意に乖離しないことがone-sample t検定で確認され、系統的過大・過小予測のないことが示された。

Alteplaseの治療効果評価: DTが従来手法を凌駕: DT個別対照を用いた対応分析では、alteplase投与後2時間目のPAP低下が有意に検出された (Wilcoxon符号順位検定、p=0.031) (Fig. 3h)。一方、n=6 donors をランダム選択した従来の非対応コホート比較では1時間後 (p=0.36)・2時間後 (p=0.78) とも有意差なしであった (Fig. 3e,g)。同一の統計的結論に到達するために、従来法では少なくともn=18 donors のEVLPが必要と試算され、DTにより必要症例数が3分の1 (n=6 donors) に削減された。移植適応と判定された肺 (n=6 donors) ではalteplase有効性が認められPAPが低下したが、移植不適肺 (n=8 donors) ではDT対比でもPAP改善なく個別にefficacy欠如が確認された。水腫量は両群とも有意差なく、安全性が示された (Fig. 3i-l)。例えば、移植適応肺におけるalteplase投与後のPAP低下は、DT対照と比較して有意な改善を示し (p=0.031)、これは従来のコホート比較では検出されなかった所見である。

考察/結論

先行研究との違い: 本研究は、Hybrid physics-informed MLアーキテクチャにより、物理法則の解釈可能性 (呼吸生理学方程式) とMLの非線形ダイナミクス捕捉能を両立した点で、これまでの医療DT研究と異なる。既存の医療DTはほぼ全例が純粋な物理ベースまたは純粋なデータ駆動型であり、両者を統合したハイブリッドフレームワークは医学領域での先例がほぼない。先行する医療DT報告 (脳萎縮・心臓電気生理・グルコースなど単一パラメータに限定) と比較して、本研究は75項目以上のパラメータを同時にモデル化しており、真にシステムレベルの臓器表現を実現している。200,000呼吸以上を環境固有の較正で注釈付けした点も他には例がなく、context-awareな予測を可能にした。

新規性: 治療評価における最大の新規性は、各治療肺にその個体自身の未治療DT対照を対置できる点である。本研究で初めて、各肺の「もし治療しなければどうなったか」をシミュレートするカウンターファクチュアル推論により、わずかn=6例のコホートで有意差を検出することに成功した。この手法はalteplaseの評価にとどまらず、CRISPR遺伝子編集、幹細胞療法、血液型修飾、免疫調節薬など多岐にわたる介入に臨床応用可能である。個体間変動というノイズを排除し、個体内の純粋な治療効果を分離できる点は、精密医療的アプローチとして今後の臨床前研究設計に大きな影響を与えるものと考えられる。

臨床応用: 本研究は世界最大のEVLPデータベース (n=951例) を基盤としており、外部施設での再現が困難という固有の強みを持つ。Webアプリケーション (https://dt-lung.streamlit.app/) として公開済みであり、コードはGitHub (https://github.com/Sage-Lab-ai/DT_Lung) でオープンアクセスである点も臨床採用を加速するうえで重要である。肺移植適応判定への応用のみならず、IPF (特発性肺線維症)・COPD (慢性閉塞性肺疾患) など慢性疾患肺での治療試験の簡素化、多臓器ex vivoシステムとの統合による全身DTへの拡張という道筋も示されている。本知見は、薬剤開発における臨床試験の効率化と、個別化医療の推進に大きく貢献する臨床的意義を持つ。

残された課題と今後の展望: 現時点でのlimitationとして、(1) トランスクリプトミクスデータが約100例と少ない、(2) EVLP評価窓が3時間 (延長は最大1週間技術的に可能)、(3) 全身薬物分布の非考慮、(4) 外部施設での検証が未実施、(5) バイオマーカーパネルの限定性 (乳酸・グルコースのみ; 312種の代謝物マーカー測定は技術的に可能) が挙げられる。今後はIPF・COPDなどの疾患肺モデルへの展開、拡張EVLPへの適用、他臓器 (肝・腎・心臓) DTとの統合、閉ループフィードバック機能の自動化が期待される。FMI (Functional Mock-up Interface) 標準の組み込みによるスケーラビリティと相互運用性の向上も将来的な検討課題として挙げられている。バイオマーカーパネルを312種に拡張した場合の予測精度の向上、ならびに外部施設における独立検証が次の優先課題となる。

方法

本研究は、2008年から2024年にかけてToronto大学 UHNで実施された連続1,000例の臨床EVLPデータを用いたレトロスペクティブコホート研究として設計された。データ欠損のある49例を除外したn=951例をDT構築に使用した。対象は疾患のない臓器提供者 (平均年齢46±16歳、男性64%) で、平均肺容量6.5±1.3 Lであった。死因は無酸素症 (40%) または脳血管障害 (32%) が主であった。EVLPはTorontoプロトコルに従い、37℃・体重あたり7 ml/kgの一回換気量・PEEP (呼気終末陽圧; positive end-expiratory pressure) 5 cmH₂O・呼吸数7回/分・FiO₂ (吸入酸素濃度; fraction of inspired oxygen) 21%の条件で少なくとも3時間施行した。

データ収集は6モダリティにわたった: (1) 生理指標 (気道圧、肺コンプライアンス、ガス交換を10 ms間隔で高解像度取得)、(2) 生化学 (電解質・酸塩基: 毎時)、(3) メタボロミクス (乳酸・グルコース: 毎時)、(4) プロテオミクス (IL-6、IL-8、IL-10、IL-1β: 多重ELISAで毎時)、(5) トランスクリプトミクス (EVLP前後の組織生検: マイクロアレイ; ssGSEA (single-sample gene set enrichment analysis) で Liberzon et al. CellSyst 2015 のHallmark遺伝子セットスコアを計算)、(6) 胸部X線 (1時間目・3時間目)。約200,000呼吸が臨床専門家によって半教師あり学習アプローチで「通常の呼吸」「評価」「気管支鏡検査」「リクルートメント」「吸気停止」「ノイズ」の6つのラベルに分類され、予測タスクに利用された。

DT構築にはハイブリッドアーキテクチャを採用した。物理法則ベースモデルとして確立した呼吸生理学方程式を高解像度換気データに適用して動的コンプライアンス・気道圧・呼気量を算出し、データ駆動型MLとしてGRU (Gated Recurrent Unit)、XGBoost、CNN (畳み込みニューラルネットワーク; convolutional neural network) を用途に応じて統合した。GRUモデルは、時系列データにおける長期的な依存関係を捉えるために、50エポック、バッチサイズ32で訓練され、Adamオプティマイザーを用いて損失関数 (MAE (mean absolute error) または MSE (mean squared error)) を最小化するように最適化された。XGBoostモデルは勾配ブースティングを用いて決定木のアンサンブルを構築し、各モデル設定に対して網羅的なハイパーパラメータグリッドサーチ (n=216モデル) が実施された。静的DTはベースラインデータのみから将来の肺機能を予測し、動的DTはリアルタイムの測定値で継続的に再較正しながら次時点を予測する構造とした。モデルの汎化性能を評価するため、20-fold交差検証と10種類の異なるランダムシードを用いた960回の訓練ラウンドが実施された。

バリデーションは独立したn=45例 (2024〜2025年) の臨床EVLPデータと、k-近傍法 (KNN; k-nearest neighbor) アプローチで過去コホートから生成されたシミュレーションn=50例の2コホートで実施された。予測の系統的バイアスを評価するため、one-sample t検定を用いて平均予測誤差がゼロから有意に乖離しないことを確認した。統計解析には Student t-test、Mann-Whitney U test、および Pearson correlation が用いられた。なお、本研究のモデル検証プロセスにおいて、肺がん研究等で汎用されるヒト肺腺がん細胞株 A549 や H1299 のトランスクリプトームデータとの整合性解析も補助的に実施された。

治療評価の対象として、EVLP中に肺動脈塞栓症 (PE; pulmonary embolism) の疑いでalteplase (組織型プラスミノーゲン活性化因子、tPA) を投与されたn=16例を抽出し (DT訓練から除外)、肺動脈圧 (PAP; pulmonary arterial pressure) を主要有効性エンドポイント、肺水腫量を安全性エンドポイントとして設定した。alteplase投与後2時間目のPAP低下を評価するため、Wilcoxon符号順位検定が用いられた。従来のコホート比較ではMann-Whitney検定が用いられた。サンプルサイズ計算も実施され、従来のコホート比較で同等の検出力を持つには少なくともn=18例が必要であることが示された。

Research Wiki

エクスプローラー

Digital Twins of Ex Vivo Human Lungs Enable Accurate and Personalized Evaluation of Therapeutic Efficacy

背景

目的

結果

考察/結論

方法

グラフビュー

目次

バックリンク