• 著者: Ymke van der Pol, Florent Mouliere
  • Corresponding author: Florent Mouliere (Amsterdam UMC, Vrije Universiteit Amsterdam, Department of Pathology, Cancer Center Amsterdam, Amsterdam, The Netherlands)
  • 雑誌: Cancer Cell
  • 発行年: 2019
  • Epub日: 2019-10-14
  • Article種別: Review
  • PMID: 31614115

背景

リキッドバイオプシーは ctDNA の SNV (single-nucleotide variant)・SCNA (somatic copy-number aberration)・再構成検出を通じた精密医療ツールとしてこの 10 年で急成長したが、「早期がん検出」への汎用展開は未達である。ctDNA は cell of origin 依存で遺伝子・エピジェネティック変化を反映する一方 (Bardelli and Pantel, 2017)、早期癌では血中に放出される腫瘍由来分子が少なく、グリオーマや腎癌では特に検出が難しい (Bettegowda et al., 2014; Zill et al., 2018)。実際、術前早期 NSCLC でさえ 2 個以上の SNV を検出できたのは半数以下に過ぎなかった (Abbosh et al. Nature 2017)。さらに加齢に伴い正常組織や造血系で somatic mutation が蓄積し (Genovese et al., 2014; Hu et al., 2018)、SNV 単独に依存する早期検出は生物学的バックグラウンドノイズと区別がつきにくい。核ゲノムの大部分を占める非変異 cfDNA の情報をどう活用するかという視点は、これまで手薄であった。cfDNA がヌクレオソームのフットプリントとして組織由来情報を内包すること (Snyder et al. Cell 2016) や、ゲノムワイドな断片化パターンが変異非依存でがんを層別化し得ること (Cristiano et al. Nature 2019) は個別に報告されていたが、これらを変異情報と束ねる統合的枠組みは依然として不足し、未解明のまま残されている (gap in knowledge)。本レビューは、この空白を cfDNA のメチル化・断片化といったエピジェネティック特徴と、腫瘍が改変する環境シグナル (血小板・免疫細胞・mtDNA) で埋める可能性を体系化する。

目的

mutation-based リキッドバイオプシーの限界を、自前のメタ解析と二項分布シミュレーションによって定量的に提示したうえで、cfDNA のメチル化・ヒドロキシメチル化・断片化 (fragmentomics)、および腫瘍由来の environmental fingerprints (tumor-educated platelets・免疫細胞・exosome・mtDNA・非核酸 DNA) を活用した早期がん検出の新戦略を体系的に整理し、各手法の検出性能と臨床実装に向けた未解決課題を明らかにすること。

結果

変異依存ctDNA検出の早期癌での感度限界:mutation-based な ctDNA 検出は late-stage で確立された一方、早期癌では検出率・感度が大きく低下する。Abbosh らは術前早期 NSCLC の血漿で 2 個以上の SNV を 96 例中 46 例 (48%) でしか検出できなかった (Abbosh et al. Nature 2017)。TEC-seq (targeted error correction sequencing) を用いた Phallen らのステージ I/II 200 例では検出感度が大腸 71%、卵巣 68%、乳 59%、肺 59% にとどまった。これらは tumor-informed sequencing で改善し得るが、腫瘍組織 DNA が利用可能な臨床シナリオに制約され、汎用スクリーニングには適さない。検出可否は (i) 腫瘍由来 DNA 分子数、(ii) 変異数、(iii) ctDNA fraction、(iv) クローナリティ、(v) 解析感度の 5 因子に依存する (Figure 2)。

二項分布シミュレーションが示す検出プラットフォーム別の上限:1,500 GE/mL・血漿 1 mL・50% DNA ロスを仮定した二項分布シミュレーションでは、検出確率は変異数と VAF に強く依存する (Figure 2A)。手法別の同時検出可能変異数は singleplex PCR で 1、multiplex PCR で約 5、amplicon sequencing で約 10、hybrid-capture sequencing で約 100、WES で約 500 と見積もられた (Figure 2B)。さらに癌種別の Mbp あたり中央値変異率を反映させると、melanoma・肺癌は 8.9 mutations/Mbp 超と高い一方、低悪性度 glioma・乳癌・膵癌・前立腺癌は 2.2 mutations/Mbp 未満と低く、変異依存検出の難易度が癌種で大きく異なることが定量化された (Figure 2C)。高悪性度 glioma は理論上は検出容易なはずだが、血液脳関門による濾過と高い ITH (intratumor heterogeneity) のため実際には最難関であり、homogeneous 変異比でも glioma 64%・clear cell 腎癌 68% と heterogeneity が高い。

汎癌種メタ解析が示す cfDNA 濃度プロファイル:著者らの 8 報メタ解析 (癌 2,176 例 vs 健常 892 例) では、年齢と健常 cfDNA 濃度に相関はみられず (Pearson R=0.097)、男女間でも有意差はなかった (Wilcoxon, p>0.05) (Figure 1A, 1B)。定量法間では spectrofluorimetric 法が qPCR 法より高値を示し、健常濃度は研究間で有意に異なった (Kruskal-Wallis, p<0.001) (Figure 1C)。バッチ効果を補正するため研究内で比較すると、データが揃う 6 研究すべてで癌は健常より有意に高濃度で、ステージ I-II・III-IV の双方で差が認められた (Student t 検定, p<0.01-0.001) (Figure 1D)。10 癌種すべてで健常対比の有意増加 (p<0.001) を示した (Figure 1E)。一方、cfDNA 濃度と mutant allele fraction の間に相関はなく (n=1,113, Pearson R=0.059, p=0.018)、cfDNA 量がそのまま腫瘍シグナル量を意味しないことが示された (Figure 1F)。

腫瘍由来 cfDNA の短断片化シグナルとサイズ選択:健常血漿 cfDNA は caspase 依存性アポトーシスを反映して 167 bp とその整数倍を中心に分布し、約 10 bp 周期の振動を示す (Figure 3A)。尿中では 82 bp 中心とさらに短い。腫瘍 fraction が増えると ctDNA は 145 bp 方向にシフトし、90-150 bp の短断片に富化する (n=200 の癌と健常 20 例の log2 比解析、Figure 3B)。この生物学的差を利用し、150 bp 以下の短断片を in vitro / in silico でサイズ選択すると ctDNA が濃縮され、コピー数・変異シグナルの検出感度が向上する (Table 2)。100 bp 以下や 250 bp 以上の特定レンジ選択は 167 bp 中心の非腫瘍 cfDNA を除去する。cfDNA の半減期が 16 分から 2 時間と短いため、壊死由来 cfDNA は未治療患者では検出されにくいが、放射線治療後には寄与が増え得る。

ゲノムワイド断片化と機械学習による変異非依存検出:Mouliere らは shallow WGS のヌクレオソーム占有パターンを機械学習で学習し、低 ctDNA fraction の腎癌・glioma・膵癌を含む複数癌を検出した (SCNA 併用で validation AUC=0.914、断片化のみで AUC=0.891)。Cristiano らの DELFI (DNA evaluation of fragments for early interception) は genome-wide の short-to-long 比に random forest を適用し、乳・肺・melanoma・卵巣・大腸・cholangiocarcinoma で AUC=0.99、glioma・腎・膵で AUC=0.91 を達成した (Cristiano et al. Nature 2019)。cfDNA の断片末端座標やヌクレオソーム占有は組織由来情報を含み (Figure 4C, 4D)、健常 cfDNA の断片化は造血系細胞のエピジェネティック特徴と一致して血中 cfDNA が主に造血系細胞死由来であることと整合する (Snyder et al. Cell 2016) (Table 1)。

メチル化ゲノムワイド解析による早期検出:aberrant な DNA メチル化は SNV 獲得以前に生じるため早期マーカーとして理想的だが、WGBS はバイサルファイト変換で 22-66% の DNA ロスを伴い臨床実装を妨げる。これを回避する pull-down 法として cfMeDIP-seq (cell-free methylated DNA immunoprecipitation sequencing) が開発され、複数癌で AUC=0.92-0.98 を示した (Shen et al. NatProtoc 2019)。他の手法も Table 1 に整理され、MCTA-seq (methylated CpG tandems amplification and sequencing) は早期 HCC で AUC=0.92-0.97、CancerDetector は肝癌で AUC=0.99、qMSP (quantitative methylation-specific PCR) は早期 NSCLC で AUC=0.89、WGBS ベースの CpG site 解析は HCC validation で AUC=0.944 を示した。CpG メチル化は細胞アイデンティティの指標であり (Moss et al., 2018)、cardiomyocyte 由来 cfDNA の検出など癌以外への展開も示された。

ヒドロキシメチル化と断片末端解析の統合的早期検出:5hmC (5-hydroxymethylcytosine) を標的とする 5hmC-Seal (5-hydroxymethylcytosine selective chemical labeling) は複数癌で validation AUC=0.93-0.97、膵癌 (PDAC) で AUC=0.74-0.97 を示した (Table 1)。断片化と Z-score を組み合わせた CAZA (chromosome arm-level Z-score analysis) + fragment size 解析は早期 HCC で 84.4% の感度を達成し、orientation-aware の OCF (orientation-aware cell-free DNA fragmentation) 解析は 67.6% 感度・93.8% 特異度を示した。これらメチル化・ヒドロキシメチル化・断片化はいずれも変異非依存で AUC=0.85 から AUC=0.99 帯の性能を示し、コンソーシアムや企業は SNV・SCNA・メチル化の組み合わせ解析へと移行している。

環境フィンガープリント:血小板・免疫・mtDNA・非核酸DNA:腫瘍は微小環境と免疫系を改変する。TEPs (tumor-educated platelets) は腫瘍由来 RNA を取り込み、Best らは 228 癌例を健常 55 例から 96% 精度で識別し、原発巣局在を 71% 精度で同定した。マクロファージは動物モデルで 1 cm3 未満の腫瘍検出に利用でき、NETs (neutrophil extracellular traps) は長鎖 DNA を含む。exosome を介した DNA 放出は限定的で、active な細胞外 DNA 分泌は autophagy・多胞体依存だが exosome 非依存の機序であることが再評価された (Jeppesen et al. Cell 2019)。NSCLC 84 例では exosomal RNA と ctDNA の併用解析で EGFR 活性化変異の検出率が 84% から 98% に向上した。mtDNA (mitochondrial DNA) は脳腫瘍異種移植動物 64 匹で 82% の検出率を示し、digital PCR の 24% を大きく上回った。Cohen らは n=1,005 の大規模データに random forest を適用し、変異とタンパクの統合で 69-98% の検出率を得た。

前処理バイアスとエピジェネティック解析の特異度課題:血漿分離・遠心条件によって cfDNA 分子の 50% 以上が解析前に失われ得るため、採血量 (現行 5 mL 超) や抽出化学の標準化が臨床実装の前提となる。親和性カラム法やビーズ法は回収断片を特定サイズに偏らせる。double-stranded ライブラリ調製は 160 bp 以下の断片を過小評価するが、single-stranded ライブラリ調製は超短鎖 cfDNA を捕捉し異なる断片化ランドスケープを明らかにする。エピジェネティックアプローチは感度を高める一方、メチル化は正常細胞や加齢・運動でも変動するため腫瘍特異度が犠牲になり、CHIP や正常組織の somatic mutation 蓄積が偽陽性源となる。WGBS で 22-66% の回収率にとどまる技術的制約と併せ、これらは特異度確保の根本課題である。

考察/結論

本レビューはリキッドバイオプシーのパラダイムシフトを体系化した。第一に、変異依存検出はこれまでの研究が late-stage で確立してきた手法だが、早期癌では癌種依存の変異率 (glioma 2.2 未満 vs melanoma 8.9 超 mutations/Mbp) と生物学的ノイズという根本制約が残る点で、従来の SNV 一辺倒のアプローチとは対照的である。既報の大規模研究 (Abbosh, Phallen, Cohen) が示した早期感度の頭打ちは、解析感度の改善だけでは超えられない。第二の新規性として、著者らは公開 8 報を統合したメタ解析で癌種間の cfDNA 濃度プロファイルを汎癌種スケールで初めて定量し、早期 (ステージ I-II) でも健常との有意差 (p<0.001) があることを本研究で初めて明確化した。さらに、これまで報告されていない統合視点として、(i) 短断片化 (145 bp) を利用する DELFI fragmentomics、(ii) cfMeDIP-seq などのメチル化、(iii) 5hmC-Seal、(iv) TEPs・mtDNA・exosome といった environmental fingerprints を、いずれも変異非依存で AUC=0.85 から AUC=0.99 の性能として一表に統合した点が新規である。臨床応用としては、multi-cancer early detection (MCED) への拡張、低腫瘍量・MRD (minimal residual disease) 監視、血液脳関門を越える脳腫瘍検出への橋渡しが具体的に期待され、臨床的有用性の核となる。一方で残された課題は多い。第一に前処理 (採血・遠心条件で cfDNA の 50% 超が失われ得る) の国際標準化、第二に 50 bp 以下・250 bp 以上の断片の正確定量、第三に multi-modal 特徴量を統合する機械学習モデルの overfitting 検証と未出現集団への一般化 (limitation)、第四に CHIP を含むバックグラウンドシグナルとの鑑別である。今後の展望として、cfDNA の genetic・epigenetic・structural・environmental fingerprints を統合する「biome-wide liquid biopsy」が早期がん検出の主流となると結論づけられる。これらの更なる検討こそが臨床現場での実証に不可欠である。

方法

本論文はナラティブレビューであり、独立した実験コホートを持たない。著者らは PubMed 上の cfDNA・ctDNA・リキッドバイオプシー関連文献を渉猟したうえで、cfDNA 濃度が公開されている 8 報 (Abbosh et al., 2017; Adalsteinsson et al., 2017; Chaudhuri et al., 2017; Cohen et al., 2018; Cristiano et al., 2019; Liu et al., 2019; Newman et al., 2016; Phallen et al., 2017) を統合した独自メタ解析を実施した。癌患者 2,194 例と健常対照 1,180 例を抽出し、対照コホートのバイアスを軽減するため健常 288 例と 30 歳未満の癌 18 例を除外し、最終的に癌 2,176 例 vs 健常 892 例を比較対象とした。統計解析は R と ggpubr パッケージで行い、年齢と cfDNA 濃度の相関は Pearson 相関係数、定量法間 (Picogreen・qPCR・Qubit・Bioanalyzer) の濃度差は Kruskal-Wallis 検定、男女差は Wilcoxon 検定、癌 vs 健常およびステージ別の濃度差は Student の t 検定で評価した。さらに mutation-based 検出の理論的検出確率を二項分布シミュレーション (binomial simulation) で推定し、開始濃度 1,500 GE/mL (genome equivalents per mL)・血漿 1 mL・前処理での 50% DNA ロスを仮定し、VAF (variant allele fraction) と変異数、Lawrence らによる 27 癌種の Mbp あたり中央値変異率を変数として算出した。DNA は全コホートでカラムベース親和性精製により抽出されたものを用いた。