- 著者: Karan K. Budhraja, Bradon R. McDonald, Michelle D. Stephens, et al. (第一著者3名equal contribution)
- Corresponding author: Muhammed Murtaza (murtaza@surgery.wisc.edu, University of Wisconsin-Madison)
- 雑誌: Science Translational Medicine
- 発行年: 2023
- Epub日: 2023-07-12
- Article種別: Original Article
- PMID: 36630480
背景
血漿cfDNA (cell-free DNA: 循環血漿中の無細胞DNA) のfragmentomics (断片化パターン解析) はがん検出の有望バイオマーカーとして注目されている。先行研究であるCristiano et al. (2019) の「断片化プロファイル法」は主として断片長分布やヌクレオソームポジショニングに着目したfragmentomics手法であり、肺・大腸・卵巣・膵・乳がん5癌種でAUC 0.94を達成した (Cristiano et al. Nature 2019)。一方、Adalsteinsson et al. (2017) は転移性固形癌での低深度WGS (whole-genome sequencing: 全ゲノムシーケンシング) による腫瘍分画推定法を確立し、Jiang et al. (2020) はcfDNA末端配列の癌特異的変化を報告した。
しかし先行研究では断片末端の「切断位置」と「塩基配列」という2次元の異常を統合定量するアプローチが確立されておらず、多癌種スクリーニングへの実装も不足していた。大規模多施設コホートを用いた前分析的頑健性と最小シーケンス深度での検証はまだ十分になされていなかった。cfDNAはアポトーシス・ネクローシス・ヌクレアーゼによって特定のゲノム位置 (ヌクレオソーム・転写因子結合部位等) を優先的に保護されたRPR (recurrently protected region: 反復的保護領域) を形成するが、腫瘍由来cfDNAではこの末端保護パターンが正常細胞と異なる可能性がある。この位置情報と配列情報の統合的逸脱定量という知識ギャップが未解明なまま残されており、臨床実装可能な多がん種早期検出システムの構築が求められていた。
目的
cfDNA断片末端の位置 (genomic position) と塩基配列 (end motif) の逸脱をゲノムワイドに統合定量するGALYFRE (Genome-wide Analysis Loci Yielding Fragment Ends) スコアおよびiwFAF (information-weighted fraction of aberrant fragments: 情報重み付き異常断片分画) メトリクスを開発し、大規模多施設統合コホート (自施設521例+公開2,147例) にて11がん種の高精度検出を実現すること。さらに腫瘍分画との相関・縦断モニタリング有効性・前分析的頑健性・最小シーケンス深度での性能を検証し、臨床実装可能性を包括的に評価すること。
結果
GALYFRE/iwFAFの多がん種識別性能:11がん種統合でのGALYFRE (iwFAF + 9種ヌクレオチド頻度組合せ) によるAUCは0.91を達成した (n=2,668 samples、Figure 4)。iwFAF単独モデルはAUC 0.78、9種ヌクレオチド頻度単独モデルはAUC 0.89であり、両者の統合がAUCを0.91に引き上げた (単純加算以上の相補的な情報量を示す)。病期別では、ステージ1期 AUC 0.87、2期 AUC 0.89、3期 AUC 0.90、4期 AUC 0.91と段階的な性能向上を示した (Figure 4B)。特異度95%固定での全ステージ感度は66.9% (95%CI 66.1-67.8%) であり、がん種別では膠芽腫94.3%・胆管癌90.8%・大腸癌77.1%・胃癌73.9%で高感度を示し、乳癌53.8%・卵巣癌45.5%で低感度であった。また、特異度90%固定での全体感度は71.2% (95%CI 70.4-72.0%) と算出された (n=2,668 samples)。がん種別AUC分布はFigure 6 (Supplementary) に示す。
腫瘍分画との高相関および腫瘍由来断片の直接同定:iwFAFスコアはichorCNA推定腫瘍分画 (ctDNA分画) と強い相関を示した (Spearman rho=0.77、P=4.66×10^-190、n=938 samples; 腫瘍分画>=3%、Figure 1B)。腫瘍分画<3%の低ctDNA例 (n=100 samples) でもSpearman rho=0.55 (p<0.001) と有意相関を維持した。転移性黒色腫でコピー数増幅領域のiwFAFが中立・欠失領域より有意に高く (p<1×10^-24、Figure 1C)、腫瘍由来異常断片が増幅領域に選択的に富化されることを示した。深部WGS (>375×) による2症例の黒色腫解析 (腫瘍分画36%・39%) では、腫瘍特異的SNV保有断片のiwFAFが野生型断片より有意に高かった (症例1: p=1.6×10^-15、症例2: p=3.6×10^-4、Figure 1D)。
縦断的追跡での治療応答モニタリング性能:転移性黒色腫および膠芽腫の縦断サンプル (n=38 samples) でiwFAFの変化が独立した腫瘍分画推定法による腫瘍分画の変化と高く整合した (黒色腫: Spearman rho=0.68、P=1.02×10^-9; 膠芽腫: Spearman rho=0.67、P=3.47×10^-3、Figure 2)。膠芽腫では腫瘍分画0.01〜1.2%という超低ctDNA域でもiwFAF変化が追跡可能であり (Figure 2)、MRI等の画像診断と相補的なモニタリング指標としての応用が示唆された。
前分析的交絡因子への頑健性と最小シーケンス深度:採血チューブ種 (3種: EDTA (ethylene diamine tetra-acetic acid: 抗凝固剤含有採血管)/PAXgene (pre-analytical extraction tube: 血漿DNA安定化採血管)/HAEM-Lok (heparin-anticoagulation mediated locking tube: ヘパリン抗凝固採血管)) 間でiwFAFに有意差なし (Spearman rho=0.93-0.96、p=0.95、Figure 5)。DNA抽出法の違いによるCohen’s d=0.226、シーケンサー機種差によるCohen’s d=0.116と、いずれも健常-がん間差と比較して微小であった。健常者n=196 subjects での年齢4群・性別間での差異なし (p=0.573および0.310)。1百万フラグメント (約1×浅層WGS相当) へのサブサンプリングでもGALYFREのAUC 0.91が維持され (変動係数0.11%、Figure 5)、低コスト実装が可能であることを示した。
ヌクレオチド頻度特徴量の選定と統合効果:断片末端±10 bpの168種のヌクレオチド頻度を算出し、iwFAFとの相関解析から9種の特徴量を選定した (Figure 3B)。選定された9種は断片内側2〜3塩基目 (positions 1’, 2’) と断片外側1塩基目 (position -1) に集中し、腫瘍由来断片に特有の配列モチーフを反映した。GALYFRE (9nt + iwFAF組み合わせモデル) のAUC 0.91はiwFAF単独 (AUC 0.78) と9nt単独 (AUC 0.89) を超え、位置情報と配列情報の統合が相乗的に性能を向上させることが示された。
考察/結論
本研究は、cfDNA断片末端の位置情報 (RPR交差) と配列情報 (end motif) を統合するGALYFRE/iwFAFを開発し、11がん種AUC 0.91・ステージ1期 AUC 0.87という高性能を自施設521例+公開2,147例 (計2,668例) の大規模統合コホートで実証した。先行研究の断片化プロファイル法 (Cristiano 2019、AUC 0.94だが主として5癌種対象) と異なり、本研究は断片末端の「位置情報 (RPR交差)」と「配列情報 (end motif)」の2次元統合という novel アプローチを提示しており、11癌種への拡張性という点で根本的に優れている。本研究で初めてゲノムワイドRPRから算出したiwFAFを断片末端配列モチーフと統合した定量スコアリングシステムが構築された。
腫瘍分画との高相関 (Spearman rho=0.77、P=4.66×10^-190) はバイオマーカーの生物学的妥当性を支持し、定性的な有無の検出から定量的モニタリングへの応用可能性も示す (液体生検パラダイム)。1百万フラグメント (約1×浅層WGS相当) でのAUC 0.91維持は、従来の30×WGSから大幅なコスト削減が可能であり多がん種スクリーニングへの実装を現実的にするという臨床的意義が大きい。確立されたスクリーニング法のない胆管癌・膵癌・胃癌での高感度 (各90.8%・72.1%・73.9%、特異度95%) は、難治性がんへの早期介入機会を開く可能性がある。
限界点として、前向きスクリーニングコホートでの性能検証が未実施であること、健常者コントロールの選定基準が解析結果に影響する可能性、特異度95%固定での感度66.9%という水準が人口ベーススクリーニングには課題となる点が挙げられる。残された課題として、採血から抽出・シーケンシング・解析まで完全な前向き標準化プロセスでの検証と、メチル化・変異・コピー数異常等の多モードcfDNAバイオマーカーとGALYFREの統合による感度・特異度の両立改善が今後の重要な検討課題として挙げられる (ctDNAモニタリング)。
方法
コホートと試験登録: 自施設コホート521例はMayo Clinic Arizona (メラノーマ患者: 多施設臨床試験 NCT02094872 参加者; 乳がん・胆管癌等の倫理委員会承認プロトコール) およびカリフォルニア大学サンフランシスコ校 (膠芽腫患者: 臨床試験 NCT02060890 参加者) から採取した血漿サンプルを含む。公開データセット2,147例 (Cristiano 2019、Adalsteinsson 2017、Jiang 2020等) と統合解析した。
健常者17例の血漿cfDNA WGS (約30×) から12.7百万カ所のRPRをゲノムワイドに同定した (中央値長39 bp、総計504.7 Mb)。各サンプルの断片について、RPRに交差する断片末端を「aberrant」、RPRをまたぐものを「nonaberrant」として判定し、断片長とGC (guanine-cytosine: グアニン-シトシン) 含量で各断片の寄与を正規化した統合スコアをiwFAFとした。断片末端±10 bpの168種のヌクレオチド頻度 (4塩基×21位置×2末端) を計算し、iwFAFとの相関が高い9種のヌクレオチド頻度特徴量を選定した。
自施設521例と公開データセット2,147例 (Cristiano 2019、Adalsteinsson 2017、Jiang 2020等) を統合し、11がん種 (乳・大腸・膵・前立腺・肝・卵巣・胃・食道・膀胱・腎・頭頸部等、合計2,668例) と健常者を対象に、深度5のrandom forest機械学習モデル (100回交差検証、80/20分割、特徴量10個) でROC解析を実施した。性能評価はAUC・特異度固定時の感度・病期別AUCを主指標とした。最小シーケンス深度評価では1百万フラグメントへのサブサンプリング (n=10回) を実施した。前分析的交絡因子評価にはCohen’s d統計量 (効果量指標) を用いた。