• 著者: Lawrence Wing-Chi Choy, et al.
  • Corresponding author: Y.M. Dennis Lo (Chinese University of Hong Kong, Hong Kong SAR)
  • 雑誌: Clinical Chemistry
  • 発行年: 2022
  • Epub日: 2022-05-03
  • Article種別: Original Article
  • PMID: 35587130

背景

血漿中のcell-free DNA (cfDNA) は、標準的な短鎖リードシーケンシング (Illumina等) では167 bp付近にピークを持つモノヌクレオソーム由来断片として検出される。しかし、短鎖cfDNAは腫瘍全体の変異・修飾情報を1分子で十分に伝えられないという根本的な限界がある。例えば、癌関連のコピー数異常、一塩基変異 (SNV)、およびDNAメチル化シグネチャの検出は、主に短鎖cfDNAに依存していた Liu et al. AnnOncol 2020。また、cfDNAのフラグメントミクス解析も、断片長、末端モチーフ、ヌクレオソームフットプリントなどの特徴が報告されているが、これらも短鎖cfDNAに焦点を当てたものであった Snyder et al. Cell 2016Cristiano et al. Nature 2019

一方、活動的なDNase分解を受けていない長鎖cfDNA (>1 kb) の存在が示唆されていたが、従来のシーケンシング技術では、ブリッジ増幅が長鎖DNA分子に不利であるため、600 bpを超える分子のシーケンシング能力が本質的に不足しており、適切に検出できなかった。さらに、DNAメチル化解析に一般的に用いられる亜硫酸水素塩処理はDNA分解を引き起こすため、長鎖DNAの特性やメチル化パターンの評価には理想的ではないという課題があった。これらの技術的制約により、癌患者における長鎖cfDNAの存在量やそのメチル化パターンに関する包括的な理解は未解明であった。Pacific Biosciences (PacBio) のSMRT (Single Molecule Real-Time) シーケンシングは、10 kb以上の長鎖リード解析と同時にポリメラーゼ動態情報からCpGメチル化を直接 (亜硫酸水素塩変換なしに) 検出できるという独自の特長を持つ Lo et al. Science 2021。この技術は、これらの課題を克服し、長鎖cfDNAの包括的な解析を可能にする可能性を秘めている。

目的

本研究の目的は、SMRT (PacBio) シーケンシングを用いて、血漿cfDNAにおける長鎖DNA断片 (>1 kb) の存在量を定量し、従来のIlluminaシーケンシングとの比較を行うことである。また、SMRT解析によって得られる単一分子メチル化情報に基づき、肝細胞癌 (HCC) 患者におけるメチル化ベースの診断能を評価することを目的とした。特に、長鎖cfDNA分子がより多くのCpGサイトを含むことで、組織由来解析の特異性が向上するかどうかを検証する。

結果

長鎖cfDNAの検出率の劇的な差: 血漿中の長鎖cfDNA (>1 kb) の割合は、SMRTシーケンシングで中央値15.7% (範囲: 6.8%-26%) であったのに対し、Illuminaシーケンシングでは中央値0.045% (範囲: 0.038%-0.052%) と、HCC患者において約350倍の差が認められた (p < 0.0001, Mann-Whitney U-test)。これはIlluminaライブラリー調製の断片化ステップが長鎖cfDNAを選択的に損失させること、またはSMRTが長鎖分子の適切な保持に優れていることを示唆する (Fig 2, B)。同様に、HBVキャリアおよび健常者においても、SMRTシーケンシングにより長鎖cfDNA (>1 kb) が豊富に検出された (それぞれ中央値16.0%、中央値16.0%)。各グループの被験者数はそれぞれn=13 (HCC)、n=13 (HBVキャリア)、n=15 (健常者) であった。

最長cfDNA分子の同定と腫瘍由来cfDNAの特性: 血漿中で検出された最長のcfDNA分子は39,781 bpに達した。腫瘍由来と同定された最長cfDNA分子は13,585 bpであり、単一分子が複数の腫瘍特異的変異・メチル化情報を同時に担える可能性を示唆する。HCC患者の腫瘍由来cfDNA (HBsAg (B型肝炎表面抗原) 陽性背景でのHCC特異的変異含有分子) は、非腫瘍由来cfDNAと比較して有意に短く (p < 0.001)、低メチル化 (中央値59.3% vs 76.9%、p < 0.001) を示した (Fig 5, A)。この低メチル化は腫瘍細胞における全般的なDNAメチル化喪失 (global hypomethylation) を反映すると考えられる。腫瘍由来cfDNA分子は合計2,413個、非腫瘍由来cfDNA分子は合計16,767個が解析された。

HCCメチル化スコアの診断能: SMRTシーケンシングで得られたcfDNA分子のメチル化情報を用いたHCCスコア (HCC患者 vs HBVキャリア+健常者) は、≥7 CpGサイトを持つ中長鎖分子 (中央値933 bp) ではAUC 0.91を達成した (Fig 5, D)。一方、1-6 CpGサイトを持つ短鎖分子 (中央値196 bp) ではAUC 0.75 (p = 0.025で有意差) と低く、長鎖cfDNA分子がより多くのメチル化情報を1分子で担うことでHCC診断能が向上することが確認された。この改善は、長鎖cfDNAがより多くのCpGサイト (例えば、1-3 kbの長鎖DNA分子の81.9%が少なくとも7つのCpGサイトを持つ) を含むため、組織特異的な情報量が増加することに起因すると考えられる (Fig 4, A)。また、HCCメチル化スコアが最も高かった上位4例は、術後3年以内に転移を伴う再発を経験しており、予後予測の可能性も示唆された。

末端モチーフと断片長の関係: <500 bpの短鎖cfDNAではC末端が最も優位であり、G末端、T末端、A末端が続いた。500 bp以降ではC末端とT末端が徐々に減少し、A末端が劇的に増加し、G末端が中程度に増加した。2 kbを超える長鎖cfDNAではA末端が最も優位となった (Fig 3, A)。この末端モチーフプロファイルの断片長に対する変化は、妊婦の長鎖血漿DNAに関する以前の報告と同様であった。C末端優位はDFFBが担うアポトーシス関連ヌクレアーゼ活性を反映し、長鎖cfDNAはDFFBの作用を受けにくい別のメカニズムで産生される可能性が示された。長鎖cfDNA (>1 kb) の4-mer末端モチーフを用いたHCCと非HCCの分類解析では、AUC 0.78であった。これはIlluminaプラットフォームを用いた先行研究のAUC 0.86-0.93と比較して低い値であった。

肝臓由来cfDNAの割合: 肝臓由来cfDNAの割合は、HCC患者で中央値11.2%と、HBVキャリア (中央値9.5%) および健常者 (中央値9.6%) と比較して高い傾向を示した (Fig 4, B)。この結果は、HCC患者において腫瘍細胞からのDNA放出が増加している可能性を裏付けるものである。特に、HBVキャリアの一例では、肝血管腫の存在が原因で肝臓由来cfDNAの割合が23.1%と異常に高かった。これは、腫瘍性病変がなくても、肝臓の細胞死が肝臓由来cfDNAの放出を増加させる可能性を示唆する。

考察/結論

本研究は、SMRT (PacBio) シーケンシングによって従来のIlluminaシーケンシングでは見落とされていた血漿中の長鎖cfDNA (>1 kb) が豊富に存在することを本研究で初めて大規模に示した。HCC患者において、SMRTシーケンシングでは長鎖cfDNAがIlluminaシーケンシングと比較して中央値で約350倍多く検出された。この劇的な差は、これまでのcfDNA研究の大部分が長鎖cfDNAを無視していたことを示す重大な発見であり、cfDNAの生物学的理解を根本的に更新するものである。

先行研究との違い: これまでのcfDNAのフラグメントミクス研究はIlluminaベースの短鎖断片に集中していたと異なり、本研究は長鎖cfDNA分子が豊富な変異・メチル化情報を1分子で担えることを示す。特に、AUC 0.91のHCCメチル化スコアは、亜硫酸水素塩変換を必要とせずに直接メチル化を評価できるSMRTの新規な優位性を実証する。腫瘍由来cfDNAが非腫瘍由来cfDNAよりも短く低メチル化であるという以前の知見は、本研究の3 kbまでの広範なサイズ範囲でも一般化できることが示された。

臨床応用: 本知見は、長鎖cfDNA解析が癌の液状生検における新たな可能性を開くことを示唆する。SMRT技術の進歩 (PacBio Revio等) により読取コストが低下しつつあり、長鎖cfDNA解析のルーティン化が将来的に可能となる。長鎖cfDNA一分子に複数の変異・メチル化・構造変異情報が含まれるため、ハプロタイプフェーズドな腫瘍ゲノム解析や、腫瘍内不均一性のより詳細な評価が実現する可能性がある。HCC以外の癌種への拡張も今後重要な研究方向となる。これは臨床応用に直結する重要な知見である。

残された課題: 今後の検討課題として、SMRT解析のコスト (Illuminaより高価)、解析スループットの向上、メチル化アルゴリズムの精度改善 (特に少数CpGサイト)、および長鎖cfDNAの生物学的産生メカニズム (DFFBとの関係、アポトーシス以外の細胞死経路) の解明が必要である。また、SMRT長鎖cfDNAのHCC以外の癌種への診断応用、および臓器移植・自己免疫疾患など非癌疾患での有用性評価も今後の重要課題である。本研究は概念実証研究であり、大規模なコホート研究による感度と特異性の評価が求められる。

方法

本研究は、香港中文大学病院管理局新界東区臨床研究倫理委員会によって承認された。健常者 (n=15)、HCC患者 (n=13)、および慢性B型肝炎ウイルス (HBV) キャリア (n=13) を対象として、書面によるインフォームドコンセントを得て募集した。HCC患者の年齢中央値は66歳 (IQR: 56-70歳) であり、非HCC患者の年齢中央値は62歳 (IQR: 49-65歳) であった。年齢中央値に統計的な有意差は認められなかった (p=0.14, Mann-Whitney U-test)。

血漿cfDNAサンプルはSMRT (PacBio Sequel II) シーケンシングで解析した。各分子の断片長と直接メチル化解析を実施した。SMRTシーケンシングでは、DNAポリメラーゼが少なくとも3回完全にシーケンスすることで得られる高忠実度リードであるCCS (circular consensus sequence) を使用し、下流解析に含めた。マッピングされた高品質CCSの中央値は、HCC患者で379,946 (IQR: 170,736-561,018)、HBVキャリアで238,244 (IQR: 189,261-297,389)、健常者で1,041,823 (IQR: 437,297-1,501,377) であった。

比較のため、同一サンプルをIllumina short-read (150 bp paired-end) でも解析し、長鎖cfDNA (>1 kb) の検出率を比較した。SMRTの動態情報 (inter-pulse duration; IPD) からCpGメチル化を直接推定し、HCCの腫瘍由来cfDNAのメチル化スコアを算出した。このスコアは、バフィーコートとHCC腫瘍組織に関連する尤度スコアを統合したものである。

さらに、長鎖cfDNAの末端モチーフ (DFFB (DNA fragmentation factor subunit beta) 等のヌクレアーゼとの関連) と断片長による分類を解析した。各cfDNA分子の5’末端の最初のヌクレオチド (A-end, T-end, C-end, G-end) を決定し、断片長に対する割合をプロットした。HCCと非HCC被験者の分類には、4-mer末端モチーフを用いた「leave-one-out」ベースのサポートベクターマシン (SVM) 解析を実施した。

腫瘍由来cfDNAは、腫瘍組織に存在するが対応するバフィーコートDNAサンプルには存在しない体細胞変異を検出することで同定した。腫瘍DNA分画の中央値は31.37% (範囲: 12.07%-49.34%) であった。