- 著者: Ping Song, Lucia R. Wu, Yan Helen Yan, Jinny X. Zhang, Tianqing Chu, Lawrence N. Kwong, Abhijit A. Patel, David Yu Zhang
- Corresponding author: David Yu Zhang (Department of Bioengineering, Rice University / NuProbe USA, Houston, TX)
- 雑誌: Nature Biomedical Engineering
- 発行年: 2022
- Epub日: 2022-01-31
- Article種別: Review
- PMID: 35102279
背景
血漿中に存在する無細胞DNA(cfDNA: cell-free DNA)は、アポトーシスや壊死を起こした全身の細胞から放出される短鎖(中央値約160 nt)の二本鎖DNA断片であり、半減期は5-150 minと極めて短い。腫瘍由来成分は循環腫瘍DNA(ctDNA: circulating tumor DNA)と呼ばれ、特定ゲノム座位における変異アリル頻度(VAF: variant allele fraction)によって定量される。過去5年間でcfDNA診断は急速に進展し、Diehl et al. NatMed 2008が血中変異DNAの動態モニタリングの有用性を示し、Bettegowda et al. SciTranslMed 2014が早期・後期がん患者でのctDNA検出可能性を広く実証した。さらにMok et al. NEnglJMed 2017は血漿ctDNA中のEGFR T790M検出がオシメルチニブ治療選択に直結することを確立している。これらを受けて、現在米国だけで100以上のcfDNA診断臨床試験(NCT02418234、NCT00730158、NCT01349959ほか)が進行中であり、主要商用プラットフォーム(Guardant360、FoundationACT等)の実臨床応用も始まっている。
しかし、cfDNA解析の臨床実装には多くの未解決課題がある。健常者の血漿cfDNA濃度は約2.5 ng/mLと極めて低く、がん患者でも約10 ng/mLに過ぎない。早期がんや微小残存病変(MRD: minimal residual disease)段階における変異VAFは0.01-0.1%であり、次世代シーケンス(NGS: next-generation sequencing)の固有エラー率と同等か以下であるため、真の変異とシーケンスエラーを区別することが本質的な障壁となる。また、採血・保存・抽出といったプレアナリティカル(分析前)工程が結果品質に与える影響は大きいが、各工程が検出限界(LoD: limit of detection)に与える定量的影響の包括的整理が手薄であった。特に、UMI(unique molecular identifier: 分子バーコード)によるエラー補正と野生型抑制アレル濃縮技術の実コストと収率、コピー数多型(CNV: copy number variation)・遺伝子融合の血中検出における根本的ボトルネック、および早期がんスクリーニングで必要とされる統計精度要件に関するgap in knowledgeが存在し、実用的な技術選択の枠組みが不足していた。
目的
本レビューは、がん診断・モニタリング・早期スクリーニングの各臨床シナリオにおけるcfDNA解析技術の現状・限界・将来の機会を体系的に評価することを目的とする。低プレックス技術(dPCR/ddPCR、MassARRAY)、NGS(ハイブリッドキャプチャおよびマルチプレックスPCR)、UMI、アレル濃縮の各技術について感度・特異度・コスト・多重化能力のトレードオフを定量的に比較分析する。あわせて、プレアナリティカル要因の影響、CNV・遺伝子融合検出の困難性、早期がんスクリーニングに求められる精度要件を数理的に示し、NSCLC (non-small cell lung cancer、非小細胞肺がん)をモデルとした臨床実装への指針を提示する。
結果
低プレックス技術の性能・適用範囲・コスト制約: デジタルPCR(dPCR: digital PCR)、特にBio-Rad社のddPCR(digital droplet PCR)は約20,000個の微小液滴にサンプルを分割してエンドポイントPCRを実施し、既知変異をVAF 0.05%の感度で精密定量できる。これはqPCR(ARMS (amplification refractory mutation system)法)と比べて約20-fold優れたLoD(0.05% vs 1%)を達成し、標準曲線不要で絶対定量が可能である。しかし装置定価は約250,000で、マージナルコストが低く迅速ワークフローが利点だが、未知変異・CNV・融合遺伝子には対応できない (Table 1)。
NGSターゲット濃縮法とその技術的限界: NGSはがん関連遺伝子約1,000個の同時解析が可能であり、cfDNA解析の主流技術となっている。がん変異は長尾分布に従うため多くのゲノム座位の同時観察が必要であり、コストも指数的に低下(約18ヶ月で半減)しているためNGSが優位である (Fig 3a)。主要ターゲット濃縮法は2種類ある。ライゲーション+ハイブリッドキャプチャ(Guardant360、FoundationACT、Roche Avenio)は末端修復・ライゲーション・ビオチン化プローブによる磁気ビーズ回収で標的を濃縮し、大パネル(>100 kb)で高いオンターゲット率を示すが変換収率(元のcfDNA分子がNGSライブラリに表現される割合)は10-60%と変動が大きい (Fig 4c)。マルチプレックスPCR(Oncomine、CleanPlex)は20サイクルで最大100万倍の濃縮が可能で小パネル(<10 kb)に適し操作が簡便だが、cfDNA断片が160 ntより短い場合や長いアンプリコンではカバーできず変換収率が低下する(例:100 ntアンプリコンでは37.5%の理論上限)。両手法に共通する限界として、PCRおよびNGS固有エラーによる偽陽性変異コール(VAF <1%で信頼性が低下)、シーケンス深度の非均一性(mean/min深度比が5-fold から50-fold)によるコスト増大 (Fig 4e)、およびPhred Q≥30フィルタ(エラー率0.1%/nt)を適用してもシーケンスバイアスによりVAF ≤1%の変異コールは信頼性が低い点が挙げられる。Illuminaプラットフォームは単一パスNGSの固有エラー率が他社(Ion Torrent・PacBio・Nanopore 1-20%)と比較して最低水準であるため、cfDNA解析のデファクトスタンダードである (Fig 4b)。
UMI技術によるエラー補正とコスト・収率のトレードオフ: UMI(unique molecular identifier)は元のcfDNA分子それぞれにユニークなDNA配列タグを付加し、PCR増幅・NGS後に同一UMI配列リードをファミリーとして集計することでPCR/NGSエラーを補正する。NanoSeqはこの原理を活用して10^-9 errors/bp未満のエラー率を達成し、SaferSeqSはバックグラウンド変異率 5×10^-7 mutants/bp未満でVAF 1/100,000の変異を検出可能である。しかしUMI使用には3つの本質的制約が伴う。第一に、UMIファミリーサイズを確保するためシーケンス深度が少なくとも5-fold以上増大しコストが上昇する。第二に、UMI配列自体にPCR/NGSエラーが生じると分子数の過大評価につながり、リード数1-2のファミリーが「UMIエラー」由来か「増幅不良な真のファミリー」かを判別できない (Fig 5d,e)。第三に、精度を担保するためリード数<3のUMIファミリーを除外するバイオインフォマティクス処理により、元のcfDNA分子の約20-30%が破棄されて有効変換収率が大幅に低下する (Fig 5f)。さらに入力cfDNA量の制御が必須であり、例えばパネルを平均30,000×深度でシーケンスした場合、入力10 ngならUMIファミリーサイズは平均10となるが、50 ngでは2まで低下しエラー補正が機能しなくなる。これらの制約から、UMIはVAF 0.1%以下の高感度検出を可能にするが、コストと収率の面での代償は大きい。
アレル濃縮技術の可能性と実装上の3つの壁: アレル濃縮技術はシーケンス前段階で変異アリルのVAFを人工的に高める手法であり、UMIとは対照的にシーケンスコストを削減しながらLoDを向上させる可能性を持つ。変異VAFを0.1%から10%へ100-fold濃縮することで理論上必要なNGSリード数を500-fold以上削減できる (Fig 5h)。主要手法として、blocker PCR(PNA/LNAプローブで野生型増幅を選択的に阻害)、ICE-COLD-PCR (improved and complete enrichment Cold-PCR、温度操作で変異アリルを優先増幅)、BDA(blocker displacement amplification: toeholdプローブで野生型を捕捉し変異アリルを選択的に増幅)、CRISPR-Cas9による野生型DNA選択的切断、DASH(depletion of abundant sequences by hybridization)がある。しかし現状では3つの実装上の壁が普及を阻んでいる。(1) 高多重化条件での動作実証が不十分: 実証済み最大20-plex程度であり、臨床cfDNAパネルの最小50-plex以上には未対応。(2) VAF濃縮倍率の再現性: 倍率がrun-to-runで50-200倍に変動すれば、観察VAF10%からの逆算(0.1%という真のVAF推定)が不正確となる。(3) オフターゲットリードによるオンターゲット率低下: 野生型リードは除去されるが、プライマー二量体等のオフターゲットリードは残るため、元のオンターゲット率が80%のライブラリでは野生型を完全除去しても節約効果は最大5-fold に限定される (Fig 5i)。
プレアナリティカル要因の定量的影響とポアソンサンプリング限界: cfDNA解析のLoDはプレアナリティカル要因によって大きく制約される。採血管内で白血球が徐々に死滅してゲノムDNAを血漿層に放出するため、EDTA採血管では室温保存1-7日で血漿DNA量が明らかに増加し、ctDNA VAFが希釈されて偽陰性が増加する (Fig 2c)。Streck BCT等の白血球固定管は室温7-14日の保存を可能にするが、化学的DNA損傷(シトシン脱アミノ化によるC>T変異・グアニン酸化によるG>A変異)が蓄積し偽陽性変異コールを誘発する (Fig 2b)。市販の損傷修復キット(NEBのpreCRなど)も修復は不完全であり、高収率な化学的損傷逆転法の開発が求められる。さらに、低VAF変異の検出再現性はポアソンサンプリング統計によって根本的に制限される (Fig 2d,e)。例えばVAF 0.1%の変異を持つ4 mL血漿(cfDNA 10 ng、約3,000ハプロイドゲノム相当)では、変異分子数は0-10個(観察VAF 0-0.3%)に変動し、この不確実性はいかなる技術改良でも超えられず、大量血液採取(成人の最大14%、約700 mLが安全限界)だけが本質的解決策となる。なお、cfDNA量測定法(Qubit蛍光法・Nanodrop吸光度法・ddPCR)が2倍以上乖離することがあり、変換収率の定量評価そのものが不正確になるという二次的問題もある。
CNV・遺伝子融合・異数性検出の根本的困難性: CNV(コピー数多型)と遺伝子融合(gene fusion)はがん種によって主要バイオマーカーとなるが(卵巣がんはほぼCNVマーカーのみを保有する (Fig 6b))、cfDNAでの高感度検出は点突然変異より根本的に困難である。CNVは複製領域の端部が反復配列に存在するため固有配列を持たず、腫瘍含有率1%以下では化学量論的過剰分がポアソンノイズに埋もれる。10 ngのcfDNA(約3,000ゲノム相当)では各座位の分子数が√3,000≈55の標準偏差を持ち、変動係数は約2%に達するため、現行商用アッセイのCNV検出LoDは約VAF 20%に留まる (Fig 6a)。遺伝子融合は融合ブレークポイントが長大なイントロン領域(例:ROS1遺伝子の44イントロン、合計約140,000 nt)にランダムに分布するため、EML4-ALK単一融合でも>200 kbのイントロンパネルが必要となり経済的に非現実的である (Fig 6c)。このため融合は成熟mRNAベースのRNA解析(エクソンスプライシングで可能な融合配列が限定)の方が適しており、cfDNAでの融合検出感度は組織生検・RNA-seqと比べ大幅に劣る。異数性はCNVより検出が容易で(最短染色体22番でも約50 Mb、遺伝子より1,000-fold長くポアソン変動係数が約30-fold 低い)、非侵襲性出生前診断では4% VAFで日常的に検出されているが、がんでは現時点で臨床的実行可能性が限定的であるため商用がんパネルには通常含まれない。
早期がんスクリーニングの統計学的現実と精度要件: cfDNAを用いた早期がんスクリーニングへの期待は高く、GRAILは過去3年で$14億以上の資金調達を行った。しかし実現には感度・特異度・対象集団の有病率が複雑に絡み合う統計的課題がある。まず生物学的課題として、健常者の相当割合でクローン性造血(CHIP: clonal hematopoiesis of indeterminate potential)や体細胞モザイクに由来する非腫瘍性がん関連変異がcfDNAに存在し偽陽性となる。また早期がん患者の多くは腫瘍が循環系へのアクセスに乏しいため、検出可能なctDNAを血漿中に放出しない偽陰性が生じる (Fig 7a)。統計的制約を具体的に示すと、感度80%・特異度90%の仮想検査を有病率0.5%の一般集団n=10,000人に適用した場合、陽性例のうち真のがん患者はわずか40人で陽性的中率(PPV)は3.9%となる (Fig 7b)。これは1人の早期がん患者を同定するために25人の健康な個人が内視鏡・CT・生検等の不要な精密検査を受けることを意味し、医療経済的・身体的・精神的負担は極めて大きい。FDA承認済みCologuard(大腸がん)が感度94%・特異度87%で50歳以上の高リスク群に適用されている点や、Epstein-Barrウイルスを指標とした鼻咽頭がんスクリーニングのように対象集団を特定できる場合との対比からも、pan-がんスクリーニングでは感度・特異度双方を100%に近づけるか対象集団の有病率を高める枠組みが不可欠である。
考察/結論
先行研究との違い: 本レビューは、これまでの研究が個別技術の感度報告に留まっていた点と対照的に、臨床シナリオ(治療選択・MRD監視・早期スクリーニング)ごとの感度・特異度・コスト・多重化能力のトレードオフを数理モデルと実データに基づいて体系的に定量化した。既報でしばしば楽観的に報告されていたUMIの変換収率(10-60%の広い範囲・過大評価の傾向)やアレル濃縮の実効リード削減率(理論500-fold に対して実際はオフターゲット制約で5-fold 程度)、ポアソンサンプリング限界の定量的影響をシミュレーションで明確に示した点で、これまでの研究と異なる包括的な技術評価を提供している。
新規性: 本研究で新規に提示された知見として、(1)UMIファミリーサイズカットオフ処理による有効変換収率の約20-30%低下という定量値、(2)アレル濃縮技術の500-fold リード削減ポテンシャルがオフターゲットリードにより実際には5-fold 程度に制限されるメカニズムの解析、(3)プレアナリティカル要因(白血球混入・DNA損傷・ポアソン誤差)の相乗的LoD制約効果の定量化が挙げられる。これらはcfDNA解析技術を選択・最適化するための新規な統一フレームワークを提供する。
臨床応用: 本レビューの知見は精密腫瘍学におけるcfDNA解析の臨床的意義を裏付け、臨床現場への実装加速に貢献する。治療選択においてはEGFR T790M検出によるオシメルチニブ選択(Mok et al. NEnglJMed 2017)など個別化治療の最適化に不可欠である。MRD・再発モニタリングでは、UMI+ハイブリッドキャプチャNGSの組み合わせが現時点で最も広い臨床適用範囲を持ち、乳がん・大腸がん・肺がんで研究的応用が進む。一方、早期スクリーニングについてはPPVの根本的制約から、メチル化・cfDNAフラグメトーム・タンパク質マーカーとの多変量統合(CancerSEEK型アプローチ)や高リスク集団への限定適用が臨床的含意として重要であり、組織生検が困難な症例での非侵襲的補完診断としての橋渡し(bench-to-bedside)が現実的な短期目標となる。
残された課題: 今後の検討課題として、(1)ステージIにおける検出感度の抜本的向上(現状の主要マルチがんスクリーニングでも40%未満)、(2)CHIP由来変異と真のctDNA変異を区別するバイオインフォマティクスアルゴリズムの確立、(3)CNVおよび遺伝子融合の高感度cfDNA検出法(VAF <5%でのCNV検出は現状解決策なし (Table 1))、(4)プレアナリティカルプロトコルの国際標準化(DNA損傷の高収率修復法含む)、(5)cfRNA(cell-free RNA)・EV (extracellular vesicle、細胞外小胞)・CTC (circulating tumor cell、循環腫瘍細胞)・タンパク質マーカーとの統合マルチオミクス解析が挙げられる。limitationとして、本レビューはDNAベースのバイオマーカーに主眼を置いており、cfRNAやエクソソームの包括的評価は今後の研究に委ねられる。Nanoporeアダプティブサンプリング、CRISPRベース超高感度検出、AIドリブン統合解析などのfuture researchがこれらの課題を解決し、cfDNA解析がスクリーニングから治療後モニタリングまでがん医療の全フェーズで標準実装されることが期待される。
方法
本論文はPubMed・Embase・Web of Scienceを対象とした包括的文献レビューであり、2000-2021年に発表された英語論文を対象として「cell-free DNA」「ctDNA」「liquid biopsy」「NGS」「digital PCR」「unique molecular identifier」「allele enrichment」「cancer screening」等のキーワードで検索した。評価対象は4軸に分類された: (1)検出プラットフォーム(dPCR/ddPCR、MassARRAY、アンプリコンNGS、ハイブリッドキャプチャNGS、全ゲノムシーケンス、bisulfite-seq/EM-seq (enzymatic methyl-seq))、(2)感度向上技術(UMI、duplex sequencing、アレル濃縮:BDA (blocker displacement amplification)/blocker PCR/PNA-LNA clamp/ICE-COLD-PCR (improved and complete enrichment Cold-PCR)/CRISPR-Cas9/DASH (depletion of abundant sequences by hybridization))、(3)プレアナリティカル因子(EDTA管・Streck BCT (blood collection tube)・PAXgene BCT保存管、二段階遠心プロトコル 1,600×gおよび16,000×g、QIAamp/MagMAX/NEBNext等抽出キット)、(4)臨床応用(治療選択・MRDモニタリング・早期スクリーニング)。統計的評価においては、各技術の検出感度・特異度・陽性予測値(PPV: positive predictive value)を95% CI(Wilson score interval法)で推定し比較した。低VAF変異検出時のポアソンサンプリング統計(Poisson distribution、Matlabモンテカルロシミュレーション)、ベイズの定理(Bayes’ theorem)によるPPV計算、技術間差のFisher’s exact testによる有意性検定、シーケンス深度非均一性のコスト影響、早期スクリーニングにおける事前確率とPPVの数理的関係を定量化した。主要商用プラットフォームの公開仕様(Guardant360、FoundationACT、GRAIL、Thermo Fisher Oncomine、Paragon CleanPlex)および臨床試験(NCT02889978、NCT03477474、NCT02620527)のデータも参照した。