A cfDNA methylation-based tissue-of-origin classifier for cancers of unknown primary

著者: Alicia-Marie Conway, Simon P. Pearce, Alexandra Clipson, Steven M. Hill, Francesca Chemi, et al. (Conway・Pearce・Clipsonは同等貢献)
Corresponding author: Caroline Dive; Natalie Cook; Dominic G. Rothwell (Cancer Research UK National Biomarker Centre / The Christie NHS Foundation Trust, Manchester, UK)
雑誌: Nature Communications
発行年: 2024
Epub日: 2024-04-04
Article種別: Original Article
PMID: 38632274

背景

原発不明癌 (CUP: Cancers of Unknown Primary) は、全固形癌の約3-5%を占める特殊な病態であり、転移巣は同定されるものの原発臓器が特定できない。CUPは診断的・治療的に極めて困難な課題を提示し、標準的な経験的化学療法への反応は不良で、患者の全生存期間中央値は数ヶ月にとどまることが報告されている Posner et al. J Pathol 2023。このため、CUP患者の予後は一般的に不良であり、新たな診断・治療戦略の開発が強く求められている。

CUP患者において原発部位 (TOO: tissue of origin) を正確に同定することは、臓器特異的治療 (ホルモン療法、標的療法、免疫療法など) の適用を可能にし、予後改善に直結すると考えられている。実際、「favorable CUP」と分類された約20%の患者は、TOO特定型治療にアクセスすることでより良好な臨床転帰を示すことが知られている Hainsworth et al. Semin Oncol 2009。しかし、標準的なTOO同定プロセスは、複数の侵襲的生検、免疫組織化学検査、画像診断を含む長い診断期間を要し、TOO特定までに中央値で7.1ヶ月かかることが報告されており、患者への負担が大きい点が課題である。

CUP患者の最大60%では、腫瘍生検が組織量不足、品質不良、壊死、あるいは免疫染色による検体消費などにより、分子解析に失敗する。このため、非侵襲的な液体生検によるTOO予測法の開発が強く求められてきたが、CUPコホートにおけるTOO液体生検の有用性はこれまで十分に検討されておらず、この領域には大きな知識のギャップが残されている。DNAメチル化パターンは、細胞分化過程で確立され、原発組織に高度に特異的なエピゲノムシグネチャーを保持するため、血漿中のcfDNA (cell-free DNA) メチル化解析から原発組織を推定することが理論的に可能である。近年、cfDNAメチル化パターンを用いた多癌種早期検出に関する研究が複数報告されており、高い精度でTOOを予測する可能性が示されている Liu et al. AnnOncol 2020、Klein et al. AnnOncol 2021。

T7-MBD-seq (メチル化CpG結合ドメインベースの捕捉シーケンス) は、低コストかつホルマリン固定パラフィン包埋 (FFPE) 検体や血漿cfDNAの両方に対応したメチル化プロファイリング技術である。本研究グループは以前に、この技術を小細胞肺癌のcfDNAメチル化解析に適用し、分子サブタイプを識別できることを報告している Chemi et al. NatCancer 2022。しかし、CUP患者コホートにおけるcfDNAメチル化解析を用いたTOO予測の臨床的有用性については、これまで十分に検討されておらず、この領域には依然として大きな知識のギャップが残されている。特に、実際のCUP患者において、cfDNAメチル化解析が診断の迅速化や治療層別化にどの程度貢献できるかは未解明な点が多く、この点が現在の診断・治療戦略における最も重要な不足点の一つである。

目的

本研究の目的は、T7-MBD-seqを用いた血漿cfDNAメチル化プロファイリングから29腫瘍クラスのTOOを予測する高精度な機械学習モデル「CUPiD」を開発することである。次に、このCUPiDモデルを独立した既知癌患者のテストコホートで検証し、その分類性能を評価する。さらに、実際のCUP患者コホートにCUPiDを適用し、TOO予測の実現可能性と、cfDNA変異解析との統合による診断・治療層別化への有用性を評価することを目的とする。最終的に、CUPiDがCUP患者の診断プロセスを迅速化し、個別化された治療選択肢を提供する可能性を実証することを目指す。

結果

CUPiDの分類性能: 独立テストコホートでの高精度予測: 独立テストコホート170例 (13癌種の癌患者143例、非癌コントロール27例) におけるCUPiDの評価では、総合multi-class AUROCは0.984という極めて高い精度を達成した (Figure 1c)。癌患者143例の全体感度は84.6% (121/143例が正しいTOO予測) であり、予測が出た125例におけるTOO精度は96.8% (121/125例が正解) であった (Figure 2a)。18/143例 (12.6%) は「未分類」とされ、4/143例 (2.8%) が誤分類であった。27例の非癌コントロールでは全例が腫瘍クラスに分類されず、特異度100%を示した。これらの結果は、CUPiDが既知の癌種に対して非常に高い識別能力を持つことを明確に示している。他のcfDNA TOO分類器の報告と比較しても、CUPiDのTOO精度96.8%は87.0-90.2%という既報の範囲よりも高精度であった。

低腫瘍分画 (TF) 検体における性能: ichorCNAによる検出下限である3%未満の低TF検体54例においても、37/54例 (67.9%) で正確なTOO予測が可能であった (Figure 2b)。これらの低TF検体のうち、16例 (30%) は「未分類」に留まり、誤分類はわずか1例であった。TFが3%を超える検体では、89例中87例 (97.8%) で正確な予測が得られた。これは、CUPiDが低腫瘍分画のサンプルにおいても、ある程度の信頼性を持ってTOOを予測できる可能性を示唆している。例えば、TFが3%未満のサンプルでは、検出された腫瘍シグナルが非癌cfDNAによる希釈を受けているにもかかわらず、メチル化プロファイリングがTOOを正確に識別できることが示された。

誤分類パターンと生物学的整合性: 4例の誤分類のうち、3例は肺腺癌患者であり、そのうち2例は肺扁平上皮癌、1例は乳癌に誤分類された。残りの1例は胆管癌患者で、膵腺癌に誤分類された。これらの誤分類は、いずれも同一臓器系または隣接する組織型間でのものであり、生物学的に理解可能なパターンであった。例えば、肺腺癌と肺扁平上皮癌は肺という同一臓器内で発生する異なる組織型であり、胆管癌と膵腺癌は肝胆膵系という共通の解剖学的領域に属する。この結果は、分類器のさらなる最適化により、同一または隣接組織からの腫瘍間の識別能力を向上させる余地があることを示唆している。

CUPパイロットコホートにおけるメチル化プロファイリングとTOO予測: CUPiDをCUPパイロットコホート41例に適用した結果、全例 (41/41例、100%) でメチル化プロファイリングが品質基準を通過した。CUPiDは32/41例 (78.0%) でTOO予測を提示した (Figure 3a)。予測できなかった9例のうち7例では推定TFが3%未満であり、そのうち5例では変異も検出されず、ctDNA含量が低いことが示唆された。最も頻度の高い予測腫瘍型は肝胆膵系 (7/32例、21.9%、うち6例が胆管癌) および女性生殖器系 (6/32例、18.75%) であった (Figure 3b)。これらの予測腫瘍型の分布は、歴史的なCUP剖検データで報告されている原発部位の分布と一致する。

CUPiD予測の臨床的整合性: 「clinically resolved」 (確定診断例、n=15) と「suspected diagnosis」 (疑診例、n=18) を合わせた33例のうち、CUPiD予測が提示されたのは26例であった。このうち23/26例 (88.5%) の予測が、確定診断または疑診と「clinically consistent」と評価された (Figure 3c)。3例が「misclassified」とされたが、そのうち1例は訓練データに含まれない稀な卵黄嚢腫瘍であり、1例は胃癌を胆管癌と誤予測、もう1例は乳癌疑いを上部消化管癌と誤予測であった。これらの結果は、CUPiDが臨床現場での診断に高い信頼性で貢献できる可能性を示している。

cfDNA変異解析との統合: 641遺伝子変異パネル解析は40/41例で成功し、33例 (82.5%) から345個の変異が検出された。患者あたりの変異数中央値は5件 (範囲0-77)、variant allele frequency (VAF) の中央値は10.4% (範囲0-61.3%) であった。OncoKB解析により、60個の変異が腫瘍形成性または腫瘍形成性が疑われると評価された。7/26例 (26.9%) には、FDA承認薬の標的となるレベル3以上のactionable変異が同定された (PIK3CA変異3例、BRAF変異1例、IDH1変異1例など)。変異解析のみでは、腫瘍型特異的変異が単一の腫瘍型のみを支持するケースはなく、変異解析単独でのTOO特定の限界が示された。ichorCNAによるTFとmutational VAFの相関はr=0.73 (p<0.00001) と良好であり、両プラットフォームの整合性が確認された。

診断期間短縮の潜在的意義: 「clinically resolved」とされた15例の診断までの中央値期間は7.1ヶ月 (範囲0.4-47.2ヶ月) であり、6例は確定診断のために追加の侵襲的生検を要した (Figure 4)。CUPiDによる血液1本からのTOO予測は、この診断期間を劇的に短縮し、侵襲的再生検を不要にする可能性を秘めている。CUPiDの実験ターンアラウンド時間は現時点で3週間であり、最適化によりさらなる短縮が見込まれる。

考察/結論

本研究は、cfDNAメチル化ベースのTOO分類器CUPiDが、29腫瘍クラスにわたる高精度予測 (AUROC 0.984、TOO精度96.8%) を実現し、実際のCUP患者コホートにおいて78%の症例で予測を提示でき、そのうち88.5%が臨床的に整合することを初めて実証した。

先行研究との違い: 既存のDNAメチル化を用いた腫瘍組織ベースのTOO分類器 (例: Moran et al. LancetOncol 2016のEPICUP) は既に報告されているが、本研究はこれを血漿cfDNAに拡張した点で重要な進歩である。これまでのcfDNA TOO分類器の報告では、TOO精度が87.0-90.2%であったのに対し、CUPiDは96.8%という高い精度を示した Liu et al. AnnOncol 2020、Klein et al. AnnOncol 2021。T7-MBD-seqはIllumina 450k/EPICアレイよりも低コストかつ高速であり、cfDNA適用における実用性に優れる点で、これまでのアプローチと異なっている。

新規性: 本研究で初めて、in silicoでのcfDNA模倣サンプル生成 (276,108サンプル、TF 0.5-10%) という独自の方法論を採用し、モデル訓練に必要な実cfDNAサンプル数を大幅に削減しながら、訓練データの多様性を確保した。この設計は、実装コスト効率化とモデルの堅牢性を両立する新規なアプローチである。また、100個のサブ分類器からなるXGBoostアンサンブルモデルの構築は、過適合を防ぎ、高い予測性能を達成する上で極めて有効であった。

臨床応用: CUPiDと変異解析の統合により、TOO予測とactionable変異の同定 (PIK3CA、BRAF、IDH1など) を血液1本から同時に取得できることが示された。これは、CUP患者が従来の経験的化学療法を超えた精密医療にアクセスするための強力な液体生検プラットフォームとなる可能性を秘めている。特に、CUPiDによって予測された全ての腫瘍型が、標準的なCUP化学療法とは異なる治療戦略 (免疫療法や標的療法など) を持つことは、CUPiD誘導型治療の実装が臨床現場に大きな影響を与える可能性を強調している。これにより、診断の迅速化と治療層別化が促進され、患者の予後改善に貢献することが期待される。

残された課題: 今後の検討課題として、より大規模なCUP患者コホートでの前向き検証が必要である。また、CUPiD誘導型TOO特定治療が全生存期間 (OS) を改善するかどうかの実証も重要である (過去の遺伝子発現プロファイリング誘導型RCTでは、全体的なOS改善は認められず、特定のサブセットでのみ有益性が示唆されている)。低TF検体での感度向上 (TF<3%での正確予測率は67.9%に留まる) も今後の課題であり、アッセイのさらなる最適化が求められる。さらに、アッセイの標準化と商業化も臨床応用に向けて不可欠である。将来的には、腫瘍種特異的actionable変異との統合深化や、免疫療法バイオマーカー (腫瘍変異負荷 (TMB)、マイクロサテライト不安定性 (MSI)) との組み合わせも、CUPiDの応用範囲を広げる可能性を秘めている。

方法

CUPiD開発のアプローチ: cfDNA中のctDNA割合 (腫瘍分画, TF) が高度に変動しうるという課題に対応するため、本研究ではin silicoアプローチを採用した。まず、TCGA (The Cancer Genome Atlas) を主体とする公開メチル化アレイデータ9,017腫瘍 (29腫瘍クラス) のベータ値をT7-MBD-seqリードカウントに換算した。次に、非癌コントロールcfDNA (NCC、n=79) とこれらの推定リードカウントをin silicoで混合することで、TF範囲0.5-10%の276,108の模倣cfDNAサンプルを生成した。肝臓癌クラスへの誤予測を防止するため、非癌肝組織アレイ (n=49) をNCCクラスに追加した。

特徴量選択: 29腫瘍クラスとNCCクラスを含む30クラス間のペアワイズ比較により、差次的メチル化領域 (DMR) を算出した。各ペアワイズ比較で差異が最大の上位250 DMRを選択し、合計22,179のユニークな領域を特徴量として採用した。これらのDMRを用いたUMAP (Uniform Manifold Approximation and Projection) による次元削減では、TCGAの9,017腫瘍サンプルの腫瘍クラス別クラスタリングが再現された。

分類器構築: 100個のgradient-boosted tree (XGBoost) サブ分類器からなるアンサンブルモデル「CUPiD」を構築した。各サブ分類器は、80%のアレイ+NCCのin silico混合サンプルで訓練され、残りの20%の保留データで検証された (平均multi-class AUROC 0.980、標準偏差 0.00521)。最終予測はアンサンブル平均スコアに基づいて実施され、単一クラスのスコアが0.5を超える場合に腫瘍予測を確定し、0.5未満または非癌クラス予測の場合は「未分類」とした。

独立テストコホート: 13癌種の癌患者143例と非癌コントロール27例を含む計170 cfDNAサンプルをT7-MBD-seqでプロファイリングした。腫瘍分画 (TF) の推定にはichorCNAを用いた (検出下限3%)。このコホートは、CUPiDの分類性能を客観的に評価するために使用された。

CUPパイロットコホート: 実際のCUP患者41例 (腺癌25/41例、低分化癌11/41例) に対して、cfDNA T7-MBD-seq (メチル化プロファイリング) と641遺伝子変異パネル解析を同時に施行した。これにより、CUPiD予測の実現可能性と、変異解析との統合による診断・治療層別化への有用性を評価した。臨床データのレビューは、CUP専門の多職種チーム (MDT) 会議の議論、病理、放射線画像、およびその後の追加調査を含め、遡及的に実施された。

統計解析: 統計解析はR (v4.2.0) およびRStudio Workbench (v.1.4.1717-3) を用いて実施された。AUROC値の算出には、Hand and Tillの方法に基づいたmulticlass roc_auc関数 (Rパッケージyardstick v1.0.0) を使用した。DMR解析では、偽発見率 (FDR) 0.001を適用した多重検定補正を行った。ichorCNA TFとmutational VAFの相関はPearson相関分析を用いて評価された。この解析では、データ分布が正規分布であると仮定したが、正式な検定は行われなかった。サンプルのサイズは、データ生成時点での血漿/cfDNAサンプルの入手可能性に基づいて決定され、統計的手法による事前決定は行われていない。実験は無作為化されておらず、研究者は実験中および結果評価において盲検化されていない。

Research Wiki

エクスプローラー

A cfDNA methylation-based tissue-of-origin classifier for cancers of unknown primary

背景

目的

結果

考察/結論

方法

グラフビュー

目次

バックリンク