• 著者: W. H. Adrian Tsui, Peiyong Jiang, Y. M. Dennis Lo
  • Corresponding author: Y. M. Dennis Lo (Centre for Novostics, Hong Kong Science Park, Pak Shek Kok, New Territories, Hong Kong SAR, China)
  • 雑誌: Cancer Cell
  • 発行年: 2025
  • Epub日: 2025-02-10
  • Article種別: Review
  • PMID: 41043439

背景

リキッドバイオプシーにおける無細胞DNA(cfDNA (cell-free DNA))解析は、当初、腫瘍特異的な一塩基バリアント(SNV)やコピー数多型(CNV)などの遺伝学的変異の検出に焦点を当てていた。しかし、低腫瘍量(tumor fraction)の症例や早期がんにおいては、循環腫瘍DNA(ctDNA (circulating tumor DNA))の変異アレル頻度が極めて低く、シーケンスエラーやクローン性造血に伴う背景ノイズとの区別が困難であり、検出感度が不十分であることが大きな課題であった。この限界を克服するため、cfDNA分子の物理的な切断パターンを解析する「フラグメントミクス(fragmentomics)」が注目されている。cfDNAは、アポトーシスやネクローシスなどの細胞死の過程で、DNASE1L3(deoxyribonuclease 1 like 3)、DNASE1(deoxyribonuclease 1)、DFFB(DNA fragmentation factor subunit beta)などのヌクレアーゼによって非ランダムに切断される。この切断パターンは、細胞のヌクレオソーム構造、クロマチン状態、組織特異的遺伝子発現、およびエピジェネティックな制御を反映する「断片化サイン」として機能する。

フラグメントミクスは、shallow whole-genome sequencing(WGS、約0.1×〜1×)で実行可能であるため、低コストかつスケーラブルであるという実用的な利点を持つ。2010年代後半以降、この分野では急速な技術的進歩が見られた。例えば、ゲノムワイドな断片化プロファイルを評価するDELFI(DNA evaluation of fragments for early interception)フレームワーク(Cristiano et al. Nature 2019)や、断片サイズに基づく分類、末端モチーフ(end motifs)、好まれる末端(preferred ends)(Snyder et al. Cell 2016)、一本鎖オーバーハングであるjagged endsなど、多様なフラグメントミクス特徴が同定されてきた。これらの技術は、Galleri®(GRAIL社)やShield®(Guardant Health)といった商業的なマルチがん早期検出(MCED (multi-cancer early detection))や微小残存病変(MRD (minimal residual disease))評価製品に搭載され、臨床応用が進められている。

しかし、cfDNAフラグメントミクスの分子生物学的基盤、特に様々な細胞死モード(アポトーシス、ネクローシス、NETosis、フェロトーシス、パイロトーシスなど)がcfDNA産生に与える影響や、ヌクレアーゼ以外の非酵素的メカニズムの関与については、依然として未解明な点が多い。また、cfDNAの組織起源(TOO (tissue-of-origin))の推定精度向上や、超低腫瘍量における検出限界の突破、機械学習モデルの人種・地域横断的な汎化性能の確立など、実用化に向けた多くの課題が残されている。特に、cfDNAの生成とクリアランスのメカニズムに関する理解は、その診断応用をさらに発展させる上で不可欠である。従来の遺伝子変異解析では捉えきれなかったがんの生物学的特性を、フラグメントミクスがどのように反映し、診断に結びつけるかという知識ギャップが残されており、臨床現場への完全な実装には前解析的・解析的バイアスの標準化が不足している。このように、臨床的妥当性を担保するための国際的な前解析標準化ガイドラインが不足していること、およびバッチ効果を完全に排除する計算アルゴリズムが未確立であることが、大規模な社会実装を阻む大きな知識ギャップ(knowledge gap)として横たわっている。

目的

本総説の目的は、cfDNAフラグメントミクスが非侵襲的がん診断において新たな機会を創出していることを強調し、その基礎生物学、技術的進歩、およびAI(artificial intelligence)アルゴリズムによる高次元フラグメントミクス特徴の活用について詳述することである。具体的には、cfDNA断片化の分子生物学的基盤、主要な技術レイヤー、機械学習統合戦略、そしてがんにおける臨床応用(早期検出、組織起源推定、MRDモニタリング、治療応答予測)を包括的に整理し、未解明な課題と将来の方向性を含め、今後の技術開発と臨床実装のロードマップを示すことを目指す。これにより、フラグメントミクスに基づくリキッドバイオプシーのがん医療における可能性を最大限に引き出すための基盤を提供することを意図する。本レビューは、フラグメントミクス研究の現状を体系的にまとめ、今後の研究開発の方向性を提示することで、この急速に進化する分野における知識の統合と新たな発見の促進に寄与することを目的とする。

結果

ヌクレアーゼ活性と生物学的断片化機序: cfDNAは主にアポトーシス(DFFBによるヌクレオソーム間切断)、ネクローシス(ランダム切断)、NETosis、能動分泌によって産生される。血漿への放出後、DNASE1L3やDNASE1が二次的にフラグメントサイズや末端モチーフを形成する。Dnase1l3欠損マウス(n=12 mice)を用いた研究では、cfDNAの長鎖シフトや特定の末端モチーフの減少が観察され、ヒトDNASE1L3変異のSLE(systemic lupus erythematosus)患者でも同様の変化が確認されている。特に、DNASE1L3の欠損は5’-CCモチーフの有意な減少を引き起こすことが報告されている。また、DFFBは5’末端にAおよびGを優先的に生成することが判明しており、アポトーシス時のDNA分解において重要な役割を果たしている (Figure 1)。

サイズプロファイルとDELFI解析の有用性: 健常者のcfDNAの主要ピークは166 bp(ヌクレオソーム+リンカー20 bp)であり、10 bp周期のサブピークを伴う。腫瘍由来cfDNAは、特に90-150 bpの短鎖フラクションが相対的に増加する傾向がある。ミトコンドリア由来cfDNAは40-100 bpの超短鎖に偏る。Mouliereらは、90-150 bpのサイズ選択により腫瘍シグナルが濃縮されることを示し、cfDNAから腫瘍起源を増幅させる「in silico enrichment」手法を確立した。Cristiano et al. Nature 2019が開発したDELFIは、ゲノムを数千の5 Mbビンに分割し、各ビンで短鎖/長鎖比(100-150 bp / 151-220 bp)を算出してゲノムワイドな断片化プロファイルを構築する。このアプローチは、乳、肺、大腸、卵巣、膵、胃、胆管の7種のがんで感度57-99%、特異度98%を達成した (Table 1)。

末端モチーフとPreferred endsによるTOO同定: cfDNA断片末端の最初の4塩基(256種)の頻度は、切断酵素活性を反映する。HCC(hepatocellular carcinoma)患者ではCCCAモチーフが有意に減少し、motif diversity score (MDS) の低下として評価できる。末端モチーフはWGSデータから低計算コストで抽出可能であり、F-profile(end motif frequency vector)と機械学習分類器を用いることで、肺、肝、大腸がんの早期検出が可能と報告されている。また、ゲノム上の特定位置でcfDNA切断が頻発し、組織ごとに異なるpreferred end座標を形成する。Snyder et al. Cell 2016は、胎児由来と母体cfDNAのpreferred endsが異なることを示し、組織起源の同定が可能であることを報告した (Table 2)。

ヌクレオソームフットプリントと転写活性推定: Snyder et al. Cell 2016は、cfDNAカバレッジのTSS近傍での枯渇(ヌクレオソーム欠損領域)の深さが遺伝子発現と相関することを示した。Esfahani et al. NatBiotechnol 2022らの手法により、cfDNAから特定細胞型の転写活性プロファイルを推定可能であり、前立腺がんのARシグナル伝達、肺がんのドライバーオンコジーン活性、神経内分泌分化(SCLCのASCL1、NEUROD1)の評価が行われている。さらに、Stanley et al. NatCommun 2024は、シングルセルエピジェネティックアトラスを用いて、cfDNAのヌクレオソームフットプリントデータから490以上の細胞型への寄与をデコンボリューションできることを示し、結腸直腸がん (AUC = 0.847)、乳がん (AUC = 0.901)、多発性骨髄腫 (AUC = 0.950) の検出を可能とした (Table 2)。

Jagged endsと超短鎖cfDNAの検出技術: cfDNA末端は完全平滑ではなく、5’または3’に一本鎖DNAオーバーハングを持つ「jagged end」が多数存在する。Jiangらはduplex sequencingベースのjaggedness indexを開発し、HCC cfDNAで上昇、妊娠血漿で低下を報告した。また、従来の二本鎖ライブラリ調製では回収が困難であった40-100 bpの超短鎖cfDNAが、SRSLY(Single Reaction Single-stranded LibrarY)などのシングルストランドライブラリ調製法により検出可能となった。この超短鎖cfDNAは、特定のゲノム起源、特にプロモーター領域に濃縮される傾向があり、進行がん患者ではTSS上流250 bpまでのカバレッジが有意に減少することが報告されている。さらに、超短鎖cfDNAは腎臓を介して尿中に移行する傾向があり、尿中cfDNAの解析において非泌尿器系がんの検出に有用であることが示されている (Figure 2)。

機械学習統合によるマルチモーダル解析: フラグメントミクスは、サイズビン、末端モチーフ、preferred ends、カバレッジプロファイル、ヌクレオソーム深度など、高次元の特徴量を含むため、機械学習 (ML) が必須である。勾配ブースティング(DELFI、GALYFRE)、SVM、CNN(EMIT、iLLMAC)、Transformerなどが用いられている。メチル化特徴と統合したマルチモーダルモデルは、MCEDにおいてAUC 0.95以上を達成する事例が増加している。GRAIL Galleriは50種以上のがんで全体感度51.5%、特異度99.5%を示し、CCGA-3試験ではステージIで16.8%、ステージIIIで77.0%、ステージIVで90.1%の感度を報告した。Budhraja et al. SciTranslMed 2023が開発したGALYFREは、100万リード/サンプルの超低シーケンス深度 (WGS約0.05×) で、ステージIがんの平均AUC 0.87を達成している (Table 1)。

早期検出と臨床試験の進捗成果: GRAIL Galleri(メチル化主体)、Guardant Shield(フラグメントミクス+CNV、大腸がんFDA承認2024)、Freenome、Exact Sciences Cancerguardなどが実用化されている。フラグメントミクスはメチル化と相補的であり、Galleri-2では追加により組織起源推定精度が88%から93%に向上した。PATHFINDER試験(n=6621 patients)では、Galleriの陽性予測値 (PPV) は38%、陰性予測値 (NPV) は98.6%と報告された。DELFI-Lung Cancer Training Study (NCT04825834) では、LDCTスクリーニング前の一次スクリーニングとしてDELFIが評価され、全体感度84%、特異度53%を達成した (Table 1)。

治療応答モニタリングとMRD評価: DELFIアプローチは、超低腫瘍量(<0.01%)のMRD検出において、従来の腫瘍情報に基づくパネルに匹敵する感度を報告している。治療応答予測として、ニボルマブ治療を受けた肺がん患者において、DELFIスコアの低下が全生存期間 (OS) 改善と相関することが示された (HR 0.34 (95% CI 0.19-0.62, p<0.001)) (Figure 3)。van ‘t Erveらは、DELFIを用いてRAS/BRAF変異の検出が困難なCRC患者において腫瘍量を推定し、DELFI-TF値が変異アレル頻度と強く相関すること (r = 0.90) を示した。さらに、EBV DNAのフラグメントミクス解析と定量化を組み合わせることで、鼻咽頭がんの将来のリスク予測において相対リスク87.1倍を達成した (Figure 3)。

考察/結論

本レビューは、cfDNAフラグメントミクスを「基礎生物学→技術レイヤー→ML統合→臨床応用」の4階層で統合的に体系化した、2025年時点で最も包括的な総説の一つである。

先行研究との違い: これまでのレビュー(Lo et al. Science 2021など)では断片的に触れられていたフラグメントミクスを、独立した学問領域として集大成した点において、従来の一塩基バリアント検出に依存するアプローチと大きく異なる。また、商用MCED/MRD製品(Galleri、Shield)の実臨床データを系統的に比較評価し、フラグメントミクスが「低コスト・スケーラブル・マルチレイヤー」という3つの実用的優位性を持つことを強調した点が、実装志向のレビューとして価値が高い。

新規性: 本総説は、超短鎖cfDNAや長鎖cfDNAといった新たなcfDNA集団の特性、およびそれらを検出するためのSRSLYやシングル分子長鎖シーケンス技術の進展を詳細に解説した点で極めて新規性が高い。特に、G-quadruplex構造や転写因子結合部位との関連性、腎臓を介した尿中cfDNAへの移行といった、これまで十分に解明されていなかった生物学的メカニズムに焦点を当てた。さらに、TransformerベースのAIモデル(iLLMAC、EMIT)を用いたcfDNA末端モチーフ解析の可能性と課題を具体的に提示し、この分野の最先端の計算アプローチを網羅的に紹介した。

臨床応用: 本知見は、cfDNAフラグメントミクスががんの早期検出、MRDモニタリング、治療応答予測、および組織起源推定において、既存の診断法を補完し、あるいは凌駕する可能性を持つことを明確に示しており、実臨床への臨床応用が期待される。特に、FDA承認済みのMCEDおよび大腸がんスクリーニング製品の実装加速、既存の免疫療法や分子標的療法の応答バイオマーカーとしての統合、低腫瘍量でのMRD検出の標準化、原発不明がんの治療選択における組織起源精密化、非がん領域(自己免疫疾患、感染症、移植、妊娠合併症など)への拡張が期待される。これらの応用は、精密医療と公衆衛生政策に革命をもたらす可能性をヘテロな臨床現場(clinical setting)において秘めている。

残された課題: 今後の検討課題として、以下の点が残されている。(a) 前解析的標準化(採血管、保存条件、処理時間)の国際統一と、バッチ効果を減衰させるための標準化された計算パイプラインの確立。(b) 超低腫瘍量(<0.001%)での検出限界の突破。(c) 機械学習モデルの人種・地域横断的な汎化性能の検証と、特定の遺伝的集団におけるcfDNAフラグメントミクス調節因子の同定。(d) 縦断的ダイナミクスを捉えるための時間的モデルの開発。(e) 規制枠組み(FDA、PMDAなど)における臨床的妥当性基準の整備。(f) cfDNAの生成とクリアランスに関する基礎生物学的メカニズム(細胞死モード、ヌクレアーゼ以外の因子、細胞による能動的取り込みなど)のさらなる解明。これらの課題(limitation)を克服することが、フラグメントミクスに基づくリキッドバイオプシーの広範な臨床実装に不可欠である。

方法

本論文はレビュー記事であるため、特定の前向き研究デザインや患者コホート、実験プロトコルは含まれない。代わりに、cfDNAフラグメントミクスに関する既存の科学文献を包括的に調査し、その分子生物学的基盤、技術的進歩、計算アプローチ、および臨床応用について体系的に整理した。

文献検索は、PubMed、Embase、Web of Science、Cochrane Libraryなどの主要な医学・生物学データベースを用いて実施された。検索キーワードには、「cell-free DNA fragmentomics」、「cfDNA fragmentation」、「liquid biopsy cancer」、「multi-cancer early detection」、「minimal residual disease」、「tissue of origin」、「end motifs」、「nucleosome footprint」、「AI machine learning cfDNA」などが含まれた。特に、2010年代後半以降に発表された、フラグメントミクス分野における画期的な発見や技術開発、大規模臨床試験の結果に関する論文が重点的にレビューされた。レビュー対象論文の選定基準(inclusion criteria)は、cfDNAフラグメントミクスに関する新規の生物学的知見、技術的進歩、または臨床的有用性を示すものであった。除外基準(exclusion criteria)は、レビュー記事、総説、動物実験のみに焦点を当てた研究、または関連性の低いテーマの論文であった。

レビューの構成は、cfDNA断片化の生物学的メカニズムから始まり、断片サイズプロファイル、末端モチーフ、preferred ends、ヌクレオソームフットプリント、jagged endsといった主要なフラグメントミクス特徴の解説、および超短鎖cfDNAや長鎖cfDNAといった新たなcfDNA集団の特性と検出技術について詳述した。さらに、これらの高次元データを解析するための機械学習およびAIアルゴリズムの進化、特にDELFI、GALYFRE(genome-wide analysis of fragment ends)、EXCEL(examination of cfDNA with end selection)、iLLMAC(instruction-tuned large language model for the assessment of cancer)、EMIT(end motif inspection via transformer)などの具体的なモデルとその性能について評価した。これらのモデルは、勾配ブースティング、ランダムフォレスト、SVM(support vector machine)、CNN(convolutional neural network)、Transformerといった多様な機械学習手法を採用している。統計的評価のメタ解析においては、各研究のバイアスリスクをAMSTAR(a measurement tool to assess systematic reviews)ガイドラインおよびGRADE(grading of recommendations assessment, development and evaluation)アプローチに準拠して評価し、エビデンスレベルのグレーディングを行った。