• 著者: Chemi F, Pearce SP, Clipson A, Hill SM, Conway AM, Richardson SA, Kamieniecka K, Caeser R, White DJ, Mohan S, Foy V, Simpson KL, Galvin M, Frese KK, Priest L, Egger J, Kerr A, Massion PP, Poirier JT, Brady G, Blackhall F, Rothwell DG, Rudin CM, Dive C
  • Corresponding author: Dominic G. Rothwell, Charles M. Rudin, Caroline Dive (Cancer Research UK Manchester Institute, University of Manchester / Memorial Sloan Kettering Cancer Center)
  • 雑誌: Nature Cancer
  • 発行年: 2022
  • Epub日: 2022-07-14
  • Article種別: Original Article
  • PMID: 35941262

背景

小細胞肺癌 (SCLC; small cell lung cancer) は、全肺癌の10%から15%を占める極めて悪性度の高い神経内分泌腫瘍であり、喫煙との強い因果関係、迅速な倍加時間、および早期からの広範な転移傾向を特徴とする (Rudin et al. NatRevDisPrimers 2021)。診断時において、患者の約3分の2はすでに遠隔転移を伴う進展期 (ES-SCLC; extensive-stage small cell lung cancer) に達しており、残りの3分の1が限局期 (LS-SCLC; limited-stage small cell lung cancer) と診断される。SCLCは初期の白金製剤併用化学療法に対して極めて高い感受性を示すものの、ほぼ全例で急速に治療耐性を獲得し、診断後の生存期間中央値は1年から2年未満にとどまる (Dingemans et al. AnnOncol 2021)。近年、抗PD-L1抗体であるアテゾリズマブなどの免疫チェックポイント阻害薬を標準化学療法に上乗せすることで生存期間の延長が示されたが、その恩恵を享受できる患者は一部に限定されている (Horn et al. NEnglJMed 2018)。

近年、ASCL1、NEUROD1、POU2F3、YAP1などの主要な転写因子 (TF; transcription factor) の発現パターンに基づく分子サブタイプ分類 (SCLC-A, SCLC-N, SCLC-P, SCLC-Y) が提唱され、各サブタイプが異なる治療脆弱性を有することが前臨床モデルにおいて明らかにされてきた (Rudin et al. NatRevCancer 2019)。しかし、これらのサブタイプを臨床現場で同定し、個別化医療に結びつける試みには大きな障壁が存在する。第一に、SCLC患者の多くは診断時に進行期であり、気管支鏡下生検などで得られる組織検体は極めて微量かつ壊死組織を多く含むため、高品質なRNAを必要とする転写物プロファイリングの実施が極めて困難である。第二に、治療経過に伴うサブタイプの動的可塑性や耐性獲得時のクローン進化を追跡するための、非侵襲的かつ継続的なモニタリング手法が不足している。

血中無細胞DNA (cfDNA; cell-free DNA) を用いたゲノム液体生検は、コピー数異常 (CNA; copy-number aberration) や体細胞変異の検出において有用性が示されてきたが、ゲノム変異プロファイルは転写因子ベースの分子サブタイプと直接対応しないため、ゲノム情報のみからサブタイプを識別することは不可能であった。DNAメチル化は遺伝子発現を制御する重要なエピゲノム機構であり、SCLCの生物学的特性を規定することが知られているが、cfDNAレベルでの全ゲノムメチル化プロファイリングによるSCLCの検出や分子サブタイプの非侵襲的識別に関する知見は未開拓であり、臨床的に実用可能な技術は未確立であった。このように、早期検出における感度の不足や、非侵襲的な分子サブタイプ判定法の欠如が、SCLCの個別化医療の進展を阻む重大な課題として残されている。

目的

本研究の目的は、第一に、極めて微量な血液検体から高感度かつ網羅的なDNAメチル化プロファイルを取得可能にする、新規のT7-MBD-seq (T7 RNA polymerase promoter-integrated methyl-binding domain sequencing) ワークフローを開発・確立することである。第二に、このcfDNAメチル化プロファイルを用いて、LS-SCLCおよびES-SCLCの患者における高感度な腫瘍検出性能を実証し、CNAなどの既存のゲノム液体生検技術に対する優位性を明らかにすることである。第三に、cfDNAメチル化スコアが患者の全生存期間 (OS; overall survival) を予測する独立した予後因子となり得るかを検証することである。最後に、患者由来異種移植 (PDX; patient-derived xenograft) モデル、循環腫瘍細胞由来外植 (CDX; circulating tumor cell-derived explant) モデル、および患者cfDNAのメチル化プロファイルを用いて、ASCL1、NEUROD1、およびダブルネガティブ (POU2F3/YAP1) の主要なSCLC分子サブタイプを非侵襲的に識別する機械学習分類器を構築し、その臨床的実現可能性を証明することである。

結果

前臨床モデルと患者cfDNAにおけるメチル化プロファイルの一致性: CDXおよびPDXモデル50例 (n=50) と健常肺組織13例 (n=13) のメチル化プロファイルを主成分分析 (PCA; principal-component analysis) により比較したところ、両者は明確に分離し、腫瘍特異的なDMRの69%がハイパーメチル化 (高メチル化) を示した (Fig. 1c, f)。これらのDMRの多くはCpGアイランド (CGI; CpG island) やその周辺領域にマッピングされた。同一患者から得られたCDXモデルと治療前cfDNAのメチル化プロファイルは、Spearman相関解析において極めて高い一致度を示した (Fig. 1e)。

cfDNAメチル化解析による腫瘍検出感度の劇的な向上: 構築した機械学習分類器を検証コホート (SCLC患者78例、NCC 41例) に適用した結果、LS-SCLC患者29例 (n=29) において93% (27/29例)、ES-SCLC患者49例 (n=49) において100% (49/49例) の感度で腫瘍を正確に検出した (Fig. 3a)。LS-SCLCにおけるAUROC (area under the receiver operating characteristic curve) は0.986、ES-SCLCでは1.00に達した。これに対し、ichorCNAを用いたコピー数解析による検出率はLS-SCLCで41.4% (12/29例)、ES-SCLCで89.8% (44/49例) にとどまり、cfDNAメチル化解析が特に早期・低腫瘍量の症例において極めて高い検出感度を有することが実証された (Fig. 3c)。特に、詳細な病期情報が得られたLS-SCLC患者20例のうち、stage Iの6例全員においてメチル化分類器は陽性と判定したが、コピー数解析では全例が検出限界以下であった (Fig. 3a)。in silico希釈実験における検出限界は0.22%の腫瘍含有量であった。

cfDNAメチル化スコアによる強力な予後予測能: SCLC患者78例 (n=78) のcfDNAから算出したメチル化スコアは、臨床病期 (p<0.0001) およびichorCNAによる腫瘍含有量 (Pearson R=0.84、p<0.0001) と強く正相関し、DNA断片長 (Pearson R=-0.37、p=0.00082) と負相関した。メチル化スコアの中央値を用いて患者を2群に分類したKaplan-Meier生存解析では、低スコア群のOS中央値 20.6 vs 高スコア群 8.5 months と有意な生存差を認めた (p=0.00015) (Fig. 4a)。多変量Cox比例ハザード回帰分析において、年齢、性別、および臨床病期を調整した後でも、連続変数としてのメチル化スコアはOSの独立した予後予測因子であることが示され、ハザード比は HR 3.60 (95% CI 1.11-11.68, p=0.033) であった (Fig. 4b)。同様に、二分化したメチル化スコアを用いた多変量解析においても、高スコア群は低スコア群と比較して死亡リスクが有意に高く、そのハザード比は HR 3.12 (95% CI 1.25-7.81, p=0.015) であった。この結果は、cfDNAメチル化スコアが腫瘍量のみならず、腫瘍の生物学的悪性度を反映する極めて有用な予後指標であることを示している。

前臨床モデルを用いたサブタイプ特異的DMRの同定: 33例 (n=33) のCDX/PDXモデルを用いたPCAにおいて、ASCL1高発現 (n=24)、NEUROD1高発現 (n=8)、およびダブルネガティブ (n=1) の3つの分子サブタイプが、メチル化プロファイルのみで明確に分離した (Fig. 5a)。公開データから抽出した366箇所のサブタイプ特異的DMRを用いて構築したxgboost分類器は、CDX/PDXモデルの全例を正確に分類した (Fig. 5b, d)。

患者cfDNAにおける分子サブタイプの非侵襲的識別と安定性: この分類器を腫瘍含有量4%以上の患者cfDNA 56例 (n=56) に適用したところ、73% (41/56例) がASCL1サブタイプ、13% (7/56例) がNEUROD1サブタイプ、14% (8/56例) がダブルネガティブサブタイプに分類された (Fig. 5e)。この分布は、過去に報告された159例 (n=159) の組織免疫組織化学 (IHC; immunohistochemistry) データにおけるサブタイプ分布 (ASCL1 75% vs NEUROD1 11% vs ダブルネガティブ 14%) と極めて良く一致しており、統計的な有意差は認められなかった (p=0.73) (Fig. 5f)。さらに、CDXモデルと対応する患者cfDNAのペア11組のうち、10組 (91%) においてサブタイプの判定結果が完全に一致した (Fig. 5e)。治療前後の複数時点でcfDNAを採取できた7例 (n=7) の縦断的解析においては、化学療法前後で主要なサブタイプの転換は観察されず、サブタイプの安定性が確認された。in silico希釈実験におけるASCL1およびNEUROD1の検出限界は、それぞれ腫瘍含有量3%および4%であった。

考察/結論

先行研究との違い: 本研究は、従来のゲノム変異プロファイル (コピー数異常や体細胞変異) の検出に焦点を当てていたアプローチと異なり、cfDNAのメチル化プロファイルが腫瘍の転写因子発現パターンを極めて正確に反映していることを示し、エピゲノム情報から非侵襲的に分子サブタイプを同定できることを実証した。また、従来のMBD-seq法は多量のDNA入力を必要とするためcfDNAへの適用が困難であったが、本研究で開発したT7-MBD-seqは1 ngという極めて微量のDNAから高精度なプロファイルを取得可能であり、技術的にも従来法と大きく異なる。

新規性: 本研究は、血中cfDNAのメチル化プロファイリングを用いることで、SCLC患者の分子サブタイプを非侵襲的に識別できることを世界で初めて実証した。また、LS-SCLC患者において93%という極めて高い感度で腫瘍を検出可能であることを示し、特に既存のコピー数解析では検出不可能であったstage Iの早期症例を全例検出できた点は、これまでに報告されていない画期的な新規知見である。さらに、cfDNAメチル化スコアが臨床病期や腫瘍含有量から独立した予後予測因子となることを新規に同定した (Klein et al. AnnOncol 2021)。

臨床応用: 本技術の臨床的有用性は極めて高い。第一に、組織生検が困難なことが多いSCLC患者において、血液検体のみから非侵襲的かつ迅速に分子サブタイプを判定できるため、サブタイプに応じた個別化医療 (例えば、ASCL1陽性例に対するDLL3標的治療、NEUROD1陽性例に対するAurora kinase阻害薬など) の臨床現場への導入を強力に支援する (Mollaoglu et al. CancerCell 2017Gay et al. CancerCell 2021)。第二に、治療経過中の複数時点で繰り返し血液採取を行うことで、治療抵抗性獲得に伴うサブタイプの動的変化や可塑性をリアルタイムにモニタリングする臨床応用が可能となる。

残された課題: 本研究の主なlimitationとして、検証コホートのサンプルサイズが比較的小さく、特に縦断的解析 (7例) やサブタイプ分類 (56例) の症例数が限られている点が挙げられる。そのため、より大規模な独立コホートを用いた外部検証が今後の検討課題である。また、極めて稀なサブタイプであるYAP1やPOU2F3 (ダブルネガティブとして一括処理された) の個別の識別能については、検体不足のため十分に評価できておらず、今後の課題として残されている。さらに、化学療法後の耐性獲得時における微小なサブポピュレーションのクローン進化を検出するためには、さらなる検出感度の向上が必要である。

方法

T7-MBD-seqプロトコルおよびライブラリ調製: 断片化されたゲノムDNAまたはcfDNA (投入量 1 ng から 35 ng) に対し、末端修復、A-tailing (Aテイル付加)、および脱リン酸化処理を施した後、T7プロモーター配列、サンプルバーコード、およびユニーク分子識別子 (UMI; unique molecular identifier) を含むカスタムヘアピンアダプターを連結した。サンプルをプールした後、メチル結合ドメイン2 (MBD2; methyl-CpG-binding domain protein 2) タンパク質を用いてメチル化DNA断片を濃縮した。Input画分 (全体の10%) と濃縮画分 (MeCap; methylation capture) の両方からin vitro transcription (IVT; 試験管内転写) を介して次世代シーケンシング (NGS; next-generation sequencing) ライブラリを作製し、同一サンプルからメチル化プロファイルとコピー数プロファイルを同時に取得した。本プロトコルの再現性は、肺癌細胞株H1975のDNAを用いた希釈実験により検証した。

臨床検体および前臨床モデル: 本研究では、循環腫瘍細胞 (CTC; circulating tumor cell) から樹立したCDXモデルおよび患者組織由来のPDXモデル計50モデル (33名のユニークな患者由来) を使用した。マウス系統には8週から16週齢のNSG (NOD/SCID/IL2Rγ-null) マウスを用いた。臨床検体として、SCLC患者78例 (LS-SCLC 29例、ES-SCLC 49例) のcfDNA、および年齢・喫煙リスクを適合させた非癌対照 (NCC; non-cancer control) 79例のcfDNAを使用した。

バイオインフォマティクスおよび機械学習分類器: シーケンスデータはGRCh38リファレンスゲノムにマッピングし (Li et al. Bioinformatics 2009)、QSEA (quantitative sequencing enrichment analysis; 定量的シーケンス濃縮分析) パッケージを用いて300 bpのゲノムウィンドウごとにメチル化レベル (β値) を算出した。コピー数異常の算出にはHMMcopy (hidden Markov model copy number analysis; 隠れマルコフモデルコピー数解析) およびichorCNAを用いた。 腫瘍検出用の機械学習分類器として、CDX/PDXモデルと健常肺/NCC cfDNAの間で同定された4,061箇所の差分のメチル化領域 (DMR; differentially methylated region) を特徴量として選定した。極めて低い腫瘍含有量をシミュレートするため、NCC cfDNAにCDX/PDXのリードを0.5%から5%の割合でin silicoスパイクインした1,951個の混合データセットを作成した。これを用いて、xgboost (extreme gradient boosting) アルゴリズムに基づくアンサンブル分類器 (100回反復学習、各回80%のサンプルを使用) を構築した。最適カットオフ値は0.25に設定され、SCLC細胞株H446を用いた連続希釈実験により検出限界を評価した。

予後解析およびサブタイプ分類: 78例のSCLC患者のcfDNAメチル化スコア (4,061 DMRの平均β値) を算出し、Kaplan-Meier法およびlog-rank検定を用いてOSを評価した。さらに、年齢、性別、および臨床病期を調整した多変量Cox比例ハザード回帰分析 (Cox regression) を実施した。 分子サブタイプ分類器の構築には、RNA-seqデータが既知の33個のCDX/PDXモデル (DESeq2 (Love et al. GenomeBiol 2014) およびlimma (Ritchie et al. NucleicAcidsRes 2015) で解析) と、公開データベース (NCI SCLC Screening Project) のSCLC細胞株59例 (ASCL1 43例、NEUROD1 7例、ダブルネガティブ9例) のメチル化アレイデータを使用した。アレイデータをQSEAオブジェクトに変換し、サブタイプ特異的な366 DMRを特定した。これに基づき、xgboostを用いてASCL1およびNEUROD1の分類器を構築し、腫瘍含有量が4%以上のcfDNA検体 (56例) に適用した。