- 著者: Sylvan C. Baca, Ji-Heui Seo, Matthew P. Davidsohn, Brad Fortunato, Karl Semaan, Shahabbedin Sotudian, Gitanjali Lakshminarayanan, Miklos Diossy, Xintao Qiu, Talal El Zarif, et al.
- Corresponding author: Matthew L. Freedman (Dana-Farber Cancer Institute / Broad Institute, Boston, MA, USA)
- 雑誌: Nature Medicine
- 発行年: 2023
- Epub日: 2023-10-30
- Article種別: Brief Communication
- PMID: 37865722
背景
循環腫瘍DNA (ctDNA) 解析は、臨床腫瘍学において非侵襲的ながん診断およびモニタリングの手段として広く普及している。しかし、既存のctDNAアッセイの大半は、体細胞変異やコピー数変化といったゲノム変異の検出に特化しており、がんの表現型やサブタイプを規定する転写プログラム、あるいは治療応答や抵抗に関わるエピゲノム変化を血液から包括的に捉える能力には大きな制限があった。このため、がんの生物学的特性をより深く理解し、個別化医療を推進するための新たなアプローチが強く求められていた。
ヒストン修飾 (H3K4me3、H3K27ac) やDNAメチル化などのエピゲノム特徴は、細胞の転写活性やクロマチン構造の動的な変化を反映する重要なバイオマーカーである。しかし、これらのエピゲノム特徴は従来、組織生検によってのみ評価可能であり、患者への侵襲性が高く、繰り返し検査が困難であるという課題があった。血漿からこれらのエピゲノム情報を非侵襲的に、かつ包括的に解析する手法の開発は、がん診断、予後予測、治療選択、および治療抵抗性モニタリングの分野において、未開拓の領域であった。
先行研究では、血漿中のヌクレオソームポジショニングから組織起源を推定するアプローチがSnyder et al. Cell 2016によって報告され、DNAメチル化を用いたがんサブタイプ同定(cfMeDIP)や、H3K27ac cfChIP-seq単独解析も試みられてきた。また、Cristiano et al. Nature 2019は、cfDNAの断片化パターンががん患者で特異的であることを示した。しかし、プロモーター活性、エンハンサー活性、およびDNAメチル化という複数のエピゲノム情報を、1つの検体から同時に、かつ統合的に評価する手法はこれまで確立されておらず、この点が未解明な領域として残されていた。特に、治療によって誘発される組織学的変換(例:神経内分泌分化)は、ゲノム変異のみでは検出が困難であり、エピゲノム解析がその検出に唯一の手段となり得るため、この領域における技術的なギャップが残されていた。既存のctDNAアッセイでは、がんの動的な生物学的特性を捉える能力が不足しており、より包括的な情報を提供する新たな技術が求められていた。
目的
本研究の目的は、1 mlという少量の血漿から複数のエピゲノムマーカー(H3K4me3、H3K27ac、panH3ac、DNAメチル化)を同時にプロファイリングする新規手法を開発することである。さらに、この開発した手法を用いて、15種類のがんにおける診断マーカーの同定、薬剤標的の発現推定、および治療抵抗機序の検出への応用可能性を、概念実証研究として検討することを目的とした。具体的には、血漿エピゲノムプロファイリングが、既存のゲノム変異ベースのctDNAアッセイでは得られない、がんの動的な生物学的情報を提供できるかを検証する。本研究は、組織生検に代わる非侵襲的なアプローチとして、がんのサブタイプ分類や治療応答予測に資するエピゲノム情報の包括的な取得を目指す。
結果
ctDNA相関調節領域 (CREs) の同定と生物学的意義: 血漿中のctDNA含量と正の相関を示すCREは、胚発生や細胞系列決定に関わる発生転写因子(FOXA1、SOX9、SOX13)やプロトオンコジーン(MYC、EZH2、EGFR)周辺のプロモーター活性化を反映することが示された。例えば、FOXA1のH3K4me3シグナルはSpearman r=0.46、p=3.7×10^-11でctDNAと相関し、SOX9ではr=0.84、p=3.8×10^-50、SOX13ではr=0.84、p=1.1×10^-49であった。また、腫瘍抑制遺伝子APCおよびPTENのプロモーターメチル化もCREに含まれた(Extended Data Fig. 2)。一方、ctDNAと負の相関を示すCREは免疫機能関連領域に濃縮しており、造血細胞由来のシグナルを反映していると考えられた(Fig. 1c)。これらの知見は、がんが胚発生期転写プログラムを再活性化するという仮説を支持するものであった。
プロモーター活性による診断マーカーおよび薬剤標的の同定: H3K4me3シグナルは、組織系列特異的遺伝子の発現パターンを反映することが示された(Fig. 1e)。CHGA(神経内分泌がん)、CDX2(消化管がん)、KRT7(CRC/Merkel cell癌)など、診断マーカーの血漿シグナルは組織免疫組織化学(IHC)パターンと一致した(各p<0.001以上、Extended Data Fig. 4)。特に、前立腺がんバイオマーカーであるPSAをコードするKLK3遺伝子のH3K4me3シグナルは、血清PSA値と強く相関し(Pearson r=0.77、p=1.1×10^-5)、ctDNA分画とは独立していた(Extended Data Fig. 5)。これは、本アッセイがKLK3プロモーター活性そのものを反映していることを示唆する。さらに、ERBB2、ERBB3、NECTIN4、DLL3など、薬剤標的遺伝子のプロモーター活性を血漿から定量化できることが示された(Fig. 1f,g)。例えば、低頻度(約3%)のHER2陽性結腸直腸癌(CRC)患者を、IHC確認前に血漿から同定する事例も示された(HER2陽性vs陰性; Wilcoxon p<0.001)。AR遺伝子のH3K4me3シグナルは前立腺がん患者n=60で有意に高値を示し(p=2.1×10^-14)、ESR1は乳がん患者n=19で高値を示した(p=4.2×10^-3)(Extended Data Fig. 4)。
エンハンサープロファイリングによる転写因子活性推定と治療抵抗検出: H3K27ac cfChIP-seqにより、乳がんにおけるエストロゲン受容体(ER)活性、前立腺がんにおけるアンドロゲン受容体(AR)活性、および腎細胞癌(RCC)におけるHIF2α活性を血漿から推定できることが示された(Extended Data Fig. 8)。ESR1プロモーターのH3K4me3シグナル(Wilcoxon p=4.9×10^-3)よりも、ER陽性乳がんで活性化される27,840個のREセットにおけるH3K27acシグナル(AUC p=5.2×10^-5)の方がERステータスをより良く識別した(Fig. 2c,d)。去勢抵抗性前立腺がん(CRPC)患者n=20では、AR遺伝子エンハンサーの活性化が検出され(p=8.6×10^-3)、これはDNAメチル化では捉えられない所見であった(同遺伝子座は良性および悪性前立腺組織ともに低メチル化のため)(Fig. 2e)。HIF2α結合部位での腎細胞癌のH3K27acシグナルも、健常者と比較して有意な上昇を示した(p=9.5×10^-3)(Extended Data Fig. 8)。
神経内分泌分化 (NE-diff) のマルチキャンサー分類器: 神経内分泌腫瘍に共通するオープンクロマチン領域(16,451箇所)へのH3K27ac集積シグナルを指標に、NE-diffを有するがん(n=22)とNE-diffを有さないがん(n=42)を識別する分類器を構築した。この分類器はROC解析でAUC=0.94を達成し(Fig. 2g)、前立腺がん、肺がん、膀胱がん、およびMerkel cell癌におけるNE-diffを識別した。本分類器は、既存のゲノムベースアッセイでは検出不可能な組織学的変換を血漿から非侵襲的に同定する能力を示した。ASCL1結合部位でのH3K27ac集積シグナルは、NE-diffを有するがん(NEPC)と有さないがん(PRAD)間で有意な差異を示し(Wilcoxon p=9.4×10^-11)、NEPC特異的FOXA1結合部位での差異も確認された(p=4.5×10^-3)(Fig. 2f, Extended Data Fig. 9)。
正常健常者との比較とアッセイ品質: 健常者血漿n=50では、造血系細胞に特異的な遺伝子(GAPDHなどのハウスキーピング遺伝子以外)のH3K4me3シグナルが主体であり、がん特異的プロモーター(KLK3、CHGAなど)のシグナルは極めて低値であった。H3K4me3シグナルと白血球遺伝子発現(GTEx whole blood TPM)との相関を健常者試料で検証した結果、高発現遺伝子ほど高いプロモーターシグナルを示すことが確認された(Fig. 1d)。これにより、本アッセイが真に転写活性を反映することが示された。
考察/結論
先行研究との違い: 本研究は、1 mlという少量の血漿から複数のエピゲノムマーカーを同時プロファイリングする新規手法(cfChIP-seq + cfMeDIP-seq)の概念実証であり、既存のctDNAアッセイを超える臨床情報を提供できる可能性を示した点で、これまでの研究、例えばSnyder et al. Cell 2016によるヌクレオソームポジショニング推定や、H3K27ac cfChIP単独解析と異なり、プロモーター活性、エンハンサー活性、およびDNAメチル化を統合的に評価できる点が本手法の優位性である。
新規性: 本研究で初めて、治療誘発性の神経内分泌分化(NE-diff; AUC=0.94)や、アンドロゲン受容体(AR)エンハンサーの活性化といった、ゲノム変異では捉えられない治療抵抗機序をエピゲノムシグナルとして血漿から検出できることを新規に示した。HER2陽性結腸直腸癌(CRC)の血漿からの同定(Wilcoxon p<0.001)や、KLK3プロモーター活性と血清PSA値の高い相関(Pearson r=0.77、p=1.1×10^-5)は、エピゲノム液体生検が既存の組織バイオマーカーの代替または補完となり得ることを示唆しており、これはこれまで報告されていない重要な知見である。
臨床応用: これらの知見は、個別化医療における臨床応用への大きな含意を持つ。エピゲノム液体生検は、がんの診断、治療選択、および治療抵抗性モニタリングにおいて、非侵襲的かつリアルタイムな情報を提供する可能性を秘めている。特に、動的なヒストン修飾のプロファイリングは、治療中のエピゲノム変化を追跡し、治療抵抗性の早期検出や最適な治療戦略の選択に貢献し、臨床現場での意思決定を支援する。
残された課題: 今後の検討課題として、本研究は進行がん患者を対象とした概念実証研究であり、早期がんや非腫瘍性疾患における本手法の性能評価が必要である。また、組織生検が提供する空間的な細胞分布情報は、液体生検では取得できないというlimitationがある。ctDNA含量が低い早期がんではシグナルが弱くなる可能性があり、さらなる感度向上が必要とされる。さらに、1 mlの血漿から複数の免疫沈降を並行して行うため、インプットDNA量が限られる中での競合が生じる点も技術的な課題として残されている。今後は、前向き大規模コホートでの検証、早期がんへの適用、および治療中の動的なエピゲノム変化を追跡する縦断的治療モニタリングへの応用が期待される。
方法
試料採取と研究規模: 本研究では、Dana-Farber Cancer Institute、National Cancer Institute、Mass General Brigham Biobankなどから血漿試料を収集した。対象は15種類の進行がん患者および健常者で、合計n=433人から1,268件の血漿エピゲノムプロファイルが作成された。血液はK2 EDTAチューブで採取され、採血後1〜6時間以内に遠心分離および血漿単離が実施された。抽出された血漿はプロテアーゼ阻害剤を添加後、分注され、急速凍結されて-80°Cで保存された。本研究では性別や年齢などの個人レベルデータは収集されなかった。
cfChIP-seqおよびcfMeDIP-seqアッセイ: cfChIP-seq (cell-free chromatin immunoprecipitation sequencing) では、1 μgの抗体(H3K4me3: Thermo Fisher PA5-27029、H3K27ac: Abcam ab4729、panH3ac: Active Motif 39139)をProtein A/Gビーズと結合させ、前処理した血漿と4°Cで一晩反応させた。洗浄後、Proteinase KおよびRNaseA (ribonuclease A) 処理、フェノール抽出、エタノール沈殿によりDNAを回収し、ThruPLEX DNA-Seq (DNA sequencing) キットでライブラリを調製した。その後、Illumina NovaSeq 6000システムで150 bp paired-endシーケンスを実施した。cfMeDIP-seq (cell-free methylated DNA immunoprecipitation sequencing) は、5-メチルシトシン抗体(Diagenode MagMeDIP Kit)を用いて同様に実施された。品質管理基準として、on-target/off-target enrichment ratio >10かつunique fragment数 × enrichment ratio >4×10^7を満たす試料のみを解析対象とした。
シーケンスデータ処理と品質評価: cfChIP-seq/cfMeDIP-seqリードは、Burrows-Wheeler Alignerバージョン0.7.1740を用いてhg19ヒトゲノムにアラインメントされた。非特異的マッピングリードおよび重複リードは除去された。MACSバージョン2.1.1.20140616を用いて、q値(FDR: false discovery rate)閾値0.01でChIP-seqピークコールを実施した。フラグメント位置はQuinlan et al. Bioinformatics 2010を用いてBEDファイルに変換された。免疫沈降特異性を評価するため、on-target/off-target enrichment ratioが計算された。on-targetサイトはEpiMapの18状態chromHMMマップから、off-targetサイトは全ての細胞タイプでマークされていない200 bpウィンドウとして定義された。
ctDNA推定: 腫瘍分画(ctDNA含量)は、低深度全ゲノムシーケンス(LP-WGS: low-pass whole-genome sequencing)データからichorCNAアルゴリズムを用いて推定された(検出下限ctDNA >0.03)。LP-WGSデータがない試料では、ctDNA相関調節領域(CRE: ctDNA-correlated regulatory element)シグナルから線形モデルを用いて推定値を算出した。
ctDNA相関調節領域 (CRE) 同定: 各エピゲノムデータタイプ別に、cfChIP-seq/cfMeDIP-seqシグナルとichorCNA由来ctDNA推定値のSpearman相関検定を実施し、FDR調整q<0.05(各タイプ上位1,000峰)をCREとして定義した。CRE近傍遺伝子の機能的濃縮はGREATツールを用いてGene Ontology (GO) アノテーションで評価された。
がん種分類器: Human Protein Atlas (HPA) データベースから「tissue enriched/enhancedかつimmune cells not detected」に該当する12,664遺伝子のプロモーターH3K4me3シグナルを特徴量として、L2正則化ロジスティック回帰モデルをscikit-learnを用いて構築した。モデル性能は10分割交差検証で評価され、AUCを最大化するようにハイパーパラメータが調整された。
エンハンサー活性の定量化: 転写因子結合部位(TFBS)におけるH3K27acシグナルに基づいて、調節領域(RE)活性を推定した。この解析には、ユニークフラグメント数>4×10^6かつctDNA含量>0.03の試料のみを含めた。TFBSのMACS2ピークコールは、幅>4 kbのサイトを除外し、元のピーク中心から3 kbの区間にリサイズされた。シグナルは2段階の正規化(ショルダー正規化と共通DNAse過敏性サイトへの正規化)を経て、各試料の集約プロファイルが作成された。
神経内分泌分化 (NE-diff) の検出: H3K27ac cfChIP-seqシグナルを用いて、神経内分泌分化に関連するREの活性により試料を分類した。特徴量セットは、複数の系統の神経内分泌腫瘍で腺癌と比較してクロマチンアクセシビリティが一貫して高い16,098箇所のサイト群であった。分類器の性能はROC曲線下面積(AUC)で評価された。