- 著者: Sami Ul Haq, Sabine Schmid, Mansi K. Aparnathi, Katrina Hueniken, Luna Jia Zhan, Danielle Sacdalan, Janice J.N. Li, Nicholas Meti, Ming S. Tsao, Michael Cabanero, Daniel de Carvalho, Geoffrey Liu, Scott V. Bratman, Benjamin H. Lok
- Corresponding author: Benjamin H. Lok (Princess Margaret Cancer Centre, University Health Network, Toronto, Canada)
- 雑誌: iScience
- 発行年: 2022
- Epub日: 2022-12-22
- Article種別: Original Article
- PMID: 36425756
背景
小細胞肺がん (small-cell lung cancer、SCLC) は全肺がんの約15%を占める高度悪性の神経内分泌腫瘍であり、初回プラチナ系化学療法に対する高い奏効率とは対照的に急速な再発を来し、5年生存率が10%未満に留まる難治性疾患である (Rudin et al. NatRevDisPrimers 2021)。SCLCのゲノム解析は近年大きく進展し、Peifer et al. 2012およびRudin et al. 2012によってTP53・RB1の普遍的欠失やSOX2増幅が同定され、George et al. 2015による大規模解析で網羅的なドライバー変異プロファイルが確立された。一方でエピゲノム、特にDNAメチル化に関しては、組織生検が困難なSCLCの特性ゆえに解析が著しく手薄であった。組織ベースのメチル化研究としてはPoirier et al. 2015 (Oncogene) がEZH2高発現と連動したメチル化定義サブタイプを、Kalari et al. 2013 (Oncogene) が神経内分泌細胞の分化ブロックをそれぞれ報告したが、いずれも手術標本や剖検組織を用いたものであり、ルーチン臨床で組織取得が困難なSCLC患者への適用には限界があった。
血漿cell-free DNA (cfDNA) を用いた液体生検は組織生検の代替として注目されており、cell-free methylated DNA immunoprecipitation followed by sequencing (cfMeDIP-seq) は膵がん・腎細胞がん・神経膠腫・頭頸部がん等で腫瘍特異的メチル化の検出に有効であることが示されてきた (Shen et al. 2018、Nature)。しかしSCLCへの系統的応用には大きな gap in knowledge が存在した。最大の技術的障壁は、血漿cfDNAの60〜90%がPBL (peripheral blood leukocyte) 由来の非腫瘍性シグナルを含み、PBL由来シグナルが腫瘍特異的メチル化シグナルを希薄化・汚染するという問題であった。既存研究の多くは健常対照血漿を参照として非がんシグナルを除去する手法を採用していたが、これでは個々のSCLC患者固有のPBLシグナルを適切に除去できないという不足が残っていた。同一患者・同一時点のPBLゲノムDNAを利用した個別化的サブトラクション法の実装と、その臨床コホートへの適用検証が求められていた。
目的
cfMeDIP-seqと新規PBLメチル化サブトラクションアルゴリズムPRIME (Peripheral blood leukocyte methylation subtraction) を組み合わせ、SCLC患者74例の血漿cfDNAから腫瘍特異的メチル化プロファイルを取得すること。さらに教師なし機械学習によりメチル化定義の予後クラスターを同定し、DMR (differentially methylated region) の経路的・ゲノム特徴的解析によってクラスターの生物学的基盤を解明すること。
結果
SCLC cfDNA メチル化プロファイルはCDX腫瘍組織と高度に一致し、NCCと明確に識別できる: cfMeDIP-seqの腫瘍代表性を検証するため、7例のSCLC患者の血漿cfDNAとその対応CDX腫瘍gDNAのゲノムワイドメチル化プロファイル (8,828,974 300bp windows) を主成分分析 (principal component analysis、PCA) および相関解析で比較した。cfDNAとCDX gDNAはPCAで高度にクラスタリングし (Fig 1C)、ゲノム全窓の正規化リードカウントの相関係数は中央値r=0.92 (n=7) と強固な一致を示した。74例のSCLC患者とNCC 20例の全ゲノムcfDNAメチル化プロファイルもPCAで明確に分離し (Fig 1D)、腫瘍特異的なメチル化シグナルが液体生検により捉えられることが確認された。DMR解析ではSCLCに51,666個、NCCに1,019個の有意な高メチル化DMRが検出された (p-adj < 0.05、log2FC > 1;Fig 1E)。SCLC のDMRはCpGアイランド・shoreに濃縮されていたのに対し、NCCのDMRはopen-sea領域に偏在し (Fig 1F)、順列解析でCpG特徴エンリッチメントの有意性が確認された (Fig 1G)。
PRIMEフィルタリングが腫瘍特異的メチル化シグナルを効果的に精製し2つのPCA群を顕在化: MethylCIBERSORT (cell-type deconvolution algorithm for methylation data) 解析によりSCLC患者血漿cfDNAにおけるPBL由来シグナルの優位性が定量的に確認された。PRIMEフィルタリング前の全ゲノム解析 (n=9,603,445 windows) では74例の血漿cfDNAのPCAにおけるPC1分散が40%、PC2分散が7%であった (Fig 2C)。PRIMEフィルタリングにより196,582個のSCLC特異的窓 (全ゲノムの約2%) に絞り込むと、PC1分散は57%へ増加し、PC2分散は4%へ低下した (Fig 2D)。この分散の変化はPRIMEがPBL由来ノイズを除去し腫瘍由来メチル化の情報量を相対的に増大させたことを示す。さらにPRIME後のPCAでは2つの明確な患者群が出現し (Fig 2D)、後のクラスタリング解析に向けた腫瘍特異的シグナルの精製に成功した。同一患者の血漿cfDNAとPBL gDNAはPCA上で明確に分離しており (Fig 2B)、PBLがcfDNAとは独立した特徴的メチル化プロファイルを持つことが視覚的に確認された。
教師なしk-means consensus clusteringにより予後的に有意差のある2クラスターを同定: PRIME後の74例に対してk-means consensus clusteringを適用した結果、k=2が最適クラスター数と判定された (Fig 3A)。Cluster A (n=31) およびCluster B (n=43) の2クラスターが同定され、両クラスターの全生存を比較したところ、Cluster Aの中央値OS 21ヶ月に対しCluster Bの中央値OS 13ヶ月と有意差が認められた (log-rank p=0.013;Fig 3D)。Cox比例ハザード回帰ではHR=2.02 (p=0.014、Table S2) であり、Cluster BがCluster Aと比較して死亡リスクが約2倍高いことが示された。病期構成ではCluster AにLS-SCLCが68% (n=21/31) と多く含まれ、Cluster BにES-SCLCが74% (n=32/43) と偏在した (Fig S8)。病期調整後にはクラスター間のOS差が有意ではなくなったが、LS・ESいずれのサブグループでも一貫してCluster BのOSがより不良であり、特にLS-SCLCでこの傾向が顕著であった (Fig S9)。また病期分類モデルとして構築したelastic-net正則化回帰モデルはLS vs ESをbalanced accuracy 85% (Table S4) で識別し、methylation profileが病期と生物学的攻撃性の双方を反映することが示された。
Cluster A vs Cluster B の差次的高メチル化DMRは経路的・遺伝子数的に大きく相違: 2クラスター間のDMR解析では、Cluster Aに174個、Cluster Bに9,037個 (Cluster A比 approximately 52-fold) の有意な高メチル化DMRが検出された (p-adj < 0.05;Fig 3B)。Cluster Aの174 DMRは137遺伝子に対応し、KEGG解析では軸索誘導 (axon guidance)・ホスホリパーゼDシグナリング経路・非小細胞肺がん関連経路が上位にエンリッチされた (Fig 3C)。Cluster Bの9,037 DMRは2,131遺伝子に対応し、神経活性リガンド・受容体相互作用 (neuroactive ligand-receptor interaction)・ケモカインシグナリング・幹細胞多能性調節経路が濃縮された (Fig 3C)。両クラスターとも高メチル化DMRの約40%が非タンパク質コード反復配列 (SINE・LINE・LTR・レトロトランスポゾン・サテライト) に対応した (Fig 4B)。特筆すべきは、Cluster Aの高メチル化DMRの65%がlong noncoding RNA (lncRNA) 窓に対応したのに対し、Cluster Bでは38%にとどまった点であり (Fig 4C)、lncRNAの高メチル化パターンの差異がSCLCの生物学的攻撃性と関連することが示唆された。
lncRNA・SINE・LINEサブセット解析が2クラスターの分離を独立して再現: 2クラスターの生物学的差異を規定するゲノム特徴を同定するため、PRIME後の196,582窓をプロモーター (11,702窓)・転写因子結合部位 (1,626窓)・miRNA (65窓)・lncRNA (80,236窓)・SINE (64,027窓)・LINE (59,901窓)・LTR (25,917窓)・サテライト (1,000窓) 等にサブセットし、各特徴の窓数とPC1分散の相関を評価した (Fig 4E)。lncRNA (Fig 4F)・SINE (Fig 4G)・LINE (Fig 4H) の各サブセットはいずれも独立してPC1分散58%を示し、全PRIME窓による元のクラスタリング (PC1=57%、Fig 2D) とほぼ同等のCluster A/B分離を再現した。これはlncRNA・SINE・LINEの差次的高メチル化が2クラスター間の生物学的差異の本質的説明因子であることを示す。CpG特徴の分布はCluster A・B間で類似しており (Fig 4A)、クラスター差異は特定のCpGアノテーション領域よりも非コード・反復配列要素の特定部位における差次的高メチル化によって規定されることが明らかとなった。
考察/結論
本研究はcfMeDIP-seqとPRIME白血球サブトラクションの組み合わせにより、SCLC患者74例の血漿cfDNAから腫瘍特異的メチル化プロファイルを取得し、予後的に有意に異なる2つのメチル化クラスターを同定した初期の大規模コホート研究である。先行する組織ベースの研究 (Poirier et al. 2015、Kalari et al. 2013) と異なり、本研究は非侵襲的な液体生検によってSCLCのエピゲノムサブタイプを捉え得ることを示した点が本研究で初めて実証された意義であり、組織取得が困難なSCLC患者への適用可能性という臨床的価値を有する。
既報のcfDNAメチル化研究の多くが健常対照血漿を参照として非腫瘍シグナルを除去するアプローチをとるのと対照的に、PRIMEアルゴリズムは同一患者・同一採血時点のPBL gDNAをサブトラクション対照として用いる。この手法は個々のSCLC患者特有の造血系メチル化バックグラウンドを除去でき、骨髄抑制や白血球分画変化が伴うSCLCに特に適した個別化的アプローチである。PRIMEによってPC1分散が40%から57%へ増加したことは、腫瘍由来シグナルの情報量の実質的な増大を定量的に示しており、PBLサブトラクションの技術的効果を客観的に裏付ける。
Cluster A (良好OS群) に軸索誘導経路の高メチル化が濃縮された所見は、SCLCの神経内分泌型 (特にASCL1型) との関連を示唆する新規の知見である。軸索誘導分子群 (SEMA3A、ROBO1等) の高メチル化による発現抑制がSCLCの局所浸潤・転移能を制御する可能性があり、この経路がSCLC生物学の攻撃性を規定するエピゲノム機構として今後の研究で注目される。一方、Cluster B (不良OS群) に濃縮された神経活性リガンド・受容体相互作用経路および幹細胞多能性調節経路は、より脱分化した攻撃的表現型と関連する可能性があり、ES-SCLCへの偏在とも整合的である。lncRNA・LINE・SINEの差次的高メチル化がクラスター分離の主要説明因子であった知見は、非コード・反復配列要素のエピゲノム制御がSCLC生物学において未解明の重要な役割を担うことを示唆し、従来のEPIC (Infinium MethylationEPIC BeadChip) / 450K (Infinium HumanMethylation450 BeadChip) アレイを超えた全ゲノム解析の優位性を体現している。
臨床応用の観点では、cfMeDIP-seq + PRIMEによる血漿メチル化クラスタリングが治療開始前の予後層別バイオマーカーとして機能する可能性がある。SCLCに対する1次治療は現在アテゾリズマブ+化学療法 (Horn et al. NEnglJMed 2018) やデュルバルマブ+化学療法 (Paz-Ares et al. Lancet 2019) が標準化されつつあるが、治療応答予測や予後層別バイオマーカーは依然として臨床的意義を持つ。液体生検メチル化プロファイリングが免疫療法応答予測に寄与できるか否かは、本研究のコホート規模では答えられず、大規模前向き試験での臨床的有用性評価が今後の課題として残されている。
本研究の主なlimitationは腫瘍画分データの欠如である。SCLCでは高腫瘍負荷から血漿cfDNAの15〜87%が腫瘍由来と報告されているが、個別の腫瘍画分が計測されていないため、メチル化プロファイルへの腫瘍画分の影響が定量的に評価できなかった。またCluster間OS差の病期調整後の有意差消失は検出力不足を示す可能性があり、大規模独立バリデーションコホートでの確認が残された課題である。今後は縦断的サンプリング (治療前・治療中・再発時) への適用により治療誘発性エピゲノム変化や薬剤耐性獲得機序の動態把握、さらには同定されたlncRNA・LINE/SINEの差次的高メチル化領域の機能的実験による検証が求められる更なる検討事項として挙げられる。
方法
トロントPrincess Margaret Cancer Centreにて倫理委員会承認のもと、1次治療開始前に採血されたSCLC患者74例 (88%が現喫煙者・元喫煙者、57%がES-SCLC (extensive-stage SCLC)、43%がLS-SCLC (limited-stage SCLC)) の血漿cfDNAおよび同一患者・同一時点の末梢血白血球gDNA (genomic DNA)、ならびにNCC (non-cancer control) 20例の血漿cfDNAに対してcfMeDIP-seqを実施した。7例では対応するCDX (circulating tumor cell-derived xenograft established in immunodeficient mice) のgDNAも解析した。cfMeDIPライブラリはDiagenode MagMeDIP Kitで調製し、Illumina NovaSeq 6000 (2×100 bp paired-end、1億リード/サンプル) でシーケンスした。
バイオインフォマティクス解析ではTrimGalore! (version 0.6.5) によるアダプタートリム、Burrows-Wheeler Alignment tool (BWA、version 0.7.17) によるhg19アライメント、SAMtools (version 1.12) による重複除去を行った。PRIME (peripheral blood leukocyte methylation subtraction) フィルタリングは全ゲノムを300 bp windowに分割し (9,603,445 windows)、ENCODEブラックリスト領域を除外後にPBL全サンプルでメジアンβ値 < 0.2 かつCG (cytosine-guanine dinucleotide) 密度 ≥ 5 の条件で腫瘍特異的窓196,582個を選定する手順とした。R package MeDEStrand (version 0.0.0.9000) でβ値を推定した。
DMR解析にはDESeq2 (version 1.30.1) を使用し、p-adj < 0.05・log2FC > 1 (高メチル化) または log2FC < -1 (低メチル化) を有意と定義した。ゲノム注釈にはannotatr (R package、version 1.16.0) を用い、ENSEMBL release-104 で非コードRNA特徴を、UCSC RepeatMasker (version 2021-09-03) で反復配列特徴をアノテーションした。KEGG経路解析にはclusterProfiler (version 3.16.1) を使用した。
教師なしクラスタリングには、PRIME後の196,582窓のうちMAD (median absolute deviation) 上位5,000窓を対象にk-means consensus clustering (ConsensusClusterPlus、k=2〜20、1,000回リサンプリング) を適用した。病期 (LS vs ES) の分類器として80:20 training:test分割でelastic-net正則化回帰モデルを構築した。全生存 (overall survival、OS) はSCLC診断日から死亡日または最終フォローアップ日まで定義し、Kaplan-Meier法・log-rank検定・Cox比例ハザード回帰 (病期調整) で解析した。ハザード比 (hazard ratio、HR) は95%信頼区間 (confidence interval、CI) とともに報告し、比例ハザード仮定はSchoenfeld残差で確認した。統計解析はR version 3.6で実施した。