• 著者: Jordan C. Cheng, Neeti Swarup, David T. W. Wong, David Chia
  • Corresponding author: David Chia (University of California, Los Angeles, Department of Pathology and Laboratory Medicine)
  • 雑誌: Frontiers in Oncology
  • 発行年: 2024
  • Epub日: 2024-03-06
  • Article種別: Review
  • PMID: 38511142

背景

血漿中の無細胞DNA (cell-free DNA; cfDNA) は、がんのステージに関わらず非侵襲的な腫瘍検出や治療効果モニタリングに有望なバイオマーカーとして広く研究されている。現在の液体生検アプローチの大部分は、二本鎖の核小体型cfDNA (mononucleosomal cell-free DNA; mncfDNA) 約167bpを対象としており、次世代シーケンス (NGS) によってその変異シグネチャー・断片長変化・メチル化パターンなどを解析する。しかし、早期がんや術後residual diseaseの検出において、循環腫瘍DNA (ctDNA) は正常cfDNAの0.01〜0.1%未満という極めて低い割合しか示さず、感度の向上が喫緊の課題となっている。

従来のdsDNA-LP (double-stranded DNA library preparation; 二本鎖DNAライブラリー調製法) は、アダプターライゲーション時に末端修復が必要なため、一本鎖DNA・ニック入りDNA・超短鎖DNAを最終ライブラリーに取り込めない構造的な欠点がある。すなわちdsDNA-LPは、血漿中に実際に存在するcfDNA集団の一部しか反映しておらず、真のcfDNA多様性を過小評価している可能性がある (Snyder et al. Cell 2016)。一方、古代DNA研究 (Svante Pääbo: 2022年ノーベル生理学・医学賞) に端を発したssDNA-LP (single-stranded DNA library preparation; 一本鎖DNAライブラリー調製法) は、変性工程を経ることで一本鎖・ニック入り・二本鎖の全種のDNAを網羅的にライブラリー化できる。ここで言う「LP (library preparation; ライブラリー調製法)」はシーケンス用ライブラリーの生成工程を指し、ssDNA-LPとdsDNA-LPはその一本鎖/二本鎖対応の別を示す。近年、Cristiano et al. Nature 2019 が全ゲノムにわたるcfDNA断片化プロファイルのがん検出への応用を示したが、これらはdsDNA-LPに基づいており、ssDNA-LPが明らかにする集団は含まれていない。

ssDNA-LPを用いることにより、約50ntのuscfDNA (ultrashort single-stranded cell-free DNA; 超短鎖一本鎖cfDNA) が健常者および複数がん種の患者血漿中に存在することが近年複数グループによって独立して報告されており、Cheng et al. iScience 2022 はuscfDNA-seqパイプラインをいち早く確立した。uscfDNAはmncfDNAとは異なるゲノム分布・機能的エレメント分布を示し、がん検出への応用が期待される新規バイオマーカー集団として注目されている。しかし、ssDNA-LPの各ライゲーション戦略を横断的に比較した総説はこれまで存在せず、uscfDNAの生物学的起源・がん検出感度への貢献については未解明の点が多く散在していた。従来の液体生検研究の大多数がdsDNA-LPを前提として設計されており、ssDNA-LPが開示するcfDNA多様性の全容が体系的に論じられていなかった点が本分野で不足していた知識領域であった。本レビューは、こうしたssDNA-LP技術の全貌を体系的にまとめ、がんの液体生検としての現状と将来的可能性を論じたものである。

目的

本総説は、(1) ssDNA-LPの分子的原理とライゲーション戦略、(2) ライブラリー調製法がcfDNA集団の認識に与える影響、(3) ssDNA-LPを用いたctDNA検出感度向上の可能性、(4) 新たに報告されたuscfDNAの特性と臨床的可能性、を包括的にレビューすることを目的とする。

結果

ssDNA-LPとdsDNA-LPの技術的差異と比較:dsDNA-LPでは末端修復によりネイティブの断片末端情報が失われ、<100bpの短鎖・ssDNA・ニック入りDNAが最終ライブラリーに含まれない (Table 1)。ssDNA-LPは熱変性 (98°C 3分) により全てのDNA分子を一本鎖化してからアダプターライゲーションを行うため、これらの集団を網羅的に回収できる。末端修復を行わないため、ネイティブの断片末端配列(end-motif profile)を忠実に保持できる点も重要な利点である。一方、ssDNA-LPは二本鎖のduplex情報にアクセスできないため、エラー抑制(duplex-based error correction)が困難という欠点がある。また、商業キットの種類や固有分子識別子 (UMI) の利用可能性においてdsDNA-LPが優位であり、コスト・手間の面での課題も存在する (Table 1)。ssDNA-LPで調製したライブラリーでは、100bp未満の断片が大幅に増加し、10.4bpの周期的パターンが3bp右方シフトとして観察される—これはネイティブ末端配列の保持によると解釈されている。

各種ssDNAライゲーション戦略の詳細:ssDNA-LPにおける核心的な技術的課題は、ssDNA分子にアダプター配列を効率的に連結する方法にある。本論文では5種の主要アプローチが詳細に解説されている (Figure 2)。(1) TdTテーリング法:ターミナルデオキシヌクレオチジルトランスフェラーゼ (TdT) がssDNAの3’末端にホモポリマー(poly-A/T)テールを付加し、相補的プライマーでハイブリダイゼーション後に二本鎖化してT4 DNAリガーゼで5’側アダプターをライゲーションする。ホモポリマーテールが下流解析に混乱をもたらす可能性がある。(2) RNAリガーゼ法:CircLigase II (circular RNA ligase II) が5’リン酸化アダプターをssDNAの3’末端にライゲーションする古代DNA由来の熱安定性一本鎖DNAライゲーション酵素を利用した戦略。Illuminaの当初のssDNA-LP規格として採用されたが、ライゲーション効率が5〜15%程度と低く、試薬コストがTdTテーリング法の約3〜5倍に相当するという欠点がある。温度依存性が高く (至適温度60°C)、短鎖ssDNA (n<50nt) ではライゲーション効率がさらに低下するため、uscfDNA解析への適用は限定的とされている。(3) スプリントアダプター法:ランダム配列スプリントオリゴ (splint oligonucleotide) がssDNAの3’末端にハイブリダイゼーションして人為的な短い二本鎖構造を形成し、T4 DNAリガーゼによる5’側アダプターのニックライゲーションを可能にする手法。Paleogenomics分野のssDNA2.0プロトコルをcfDNA用に最適化した改良版で、RNAリガーゼ法と比較してライゲーション効率が高く (約20〜35%)、試薬コストが低い。50nt以上の断片において安定した回収率が示されており、アダプターダイマー形成が少なく低鋳型量サンプルに有利とされる。cfDNA研究では血漿・尿・唾液にわたる多様な体液サンプルへの応用実績があり、ネイティブの断片末端情報を保持した高品質ライブラリーを生成できる点が評価されている (n=10以上の検討で再現性確認)。(4) TACS-TOPO (TdT-mediated Adenosine Connector Sequencing-Topoisomerase) 法:TdT介在アデノシンコネクターにTS2126 RNAリガーゼを組み合わせた高効率法。アダプターダイマー形成を抑制するため、VTopoI (vaccinia virus topoisomerase I) を第二アダプターライゲーションに使用する点が革新的である。(5) CLAMP-Seq (Circularization Ligation Amplification with Multiple-target Probes Sequencing) 法:ssDNAを環状化後、標的遺伝子特異的プライマーで選択的増幅を繰り返す手法。KRAS変異検出においてddPCR (droplet digital PCR) との97.4%一致率、NSCLC (n=134) での組織遺伝子型解析との94.8%一致率が示されている。各手法にはそれぞれ効率・コスト・情報量のトレードオフがある (Figure 2)。

ssDNA-LP使用時のcfDNA多様性:複数の研究グループが同一DNA抽出物をdsDNA-LPとssDNA-LPで処理し比較した結果、ssDNA-LPでは共通してmncfDNA 167bpのピークが維持されつつ、30-80bpの断片集団が顕著に増加することが示された。大腸がん患者の変異アリル頻度 (MAF) が異なる8検体 (68.6%〜0.9%) を用いた比較では、ssDNA-LPはdsDNA-LPと比べて100bp未満の領域の読み取り数が10倍増加し (p<0.001)、断片化プロファイルの差異がより顕在化した。また、大腸がん患者の深部全ゲノムシーケンス (30× coverage) においてもssDNA-LPは大腸がん vs 健常者間の断片化差異をより鮮明に示した。

uscfDNAの特性と生物学的意義:uscfDNAは低分子量DNA抽出法とssDNA-LPの組み合わせにより初めて可視化された。5種の抽出法が報告されており (Table 2)、いずれも従来のQiaC (QIAGEN standard cfDNA extraction column; QIAGENシリカカラム標準法) より多量のuscfDNAを回収できる。代表的手法: (1) QIAGEN miRNA抽出プロトコル (QiaM)、(2) SPRI (solid-phase reversible immobilization) 磁気ビーズ+フェノール:クロロホルム法、(3) 磁気ビーズ法 (QIAsymphony)、(4) PPIP (polymer precipitation and isopropanol precipitation; ポリマー沈殿イソプロパノール法)、(5) 直接捕捉法 (ビオチン化ランダムプローブ)。uscfDNAの定量は困難で、スパイクイン実験では血漿中濃度約2.0 ng/mLと推定されるが、標準化方法は確立されていない (Table 2)。

uscfDNAの一本鎖性は複数の独立したアプローチで確認されている。一本鎖特異的ヌクレアーゼ (S1、Exo1) による消化ではuscfDNAが特異的に消化され、二本鎖特異的DNase (dsDNase) では消化されない。dsDNA-LPでのライブラリー調製ではuscfDNAが検出されず、熱変性を省いたssDNA-LPでもuscfDNAが検出されることから、内因的に一本鎖であることが確認されている。また、ニック修復酵素処理後もuscfDNAは減少しないため、mncfDNAのニックから派生したものではないと結論付けられている。

ゲノム分布においてuscfDNAはmncfDNAと異なる特性を示す。染色体上の分布: uscfDNAはより均一に分布し、テロメアや染色体体部のホットスポットに多い。機能的エレメント: mncfDNAがイントロジェニック配列に富むのに対し、uscfDNAはプロモーター・エクソン・イントロン領域に富み、ゲノムの配列比率に近い。サイズ特異性: 45-55ntの断片でプロモーター領域の比率が最大となる。G-カドルプレックス形成配列: uscfDNAにはmncfDNAと比べてG-カドルプレックス形成能の高い配列が豊富で、これはがん遺伝子発現調節と関連する。エンドモチーフプロファイル: mncfDNAとuscfDNAではエンドモチーフが異なり、uscfDNAはヌクレアーゼ活性の非ランダム性を反映している。起源としては、転写因子結合部位や活発に転写される染色体領域の露出したDNA鎖が、ヌクレアーゼ (DNase1、DNASE1L3、DFFBなど) によって分解される過程で生成されると推測されている。

がん検出への応用:ctDNA検出における有望性:ssDNA-LPを用いたctDNA変異検出の前向き研究として最も大規模なものは、Liu et al. による膵がん患者 (n=112) の検討であり、膵がん関連62遺伝子を対象としたカスタムパネルでがん特異変異を88%の検体で、KRAS変異を70%で検出し (p<0.001 vs dsDNA-LP)、組織シーケンシングと高い一致を示した。特筆すべきは、KRAS変異含有断片の相当割合が100bp未満の短い断片であり、早期膵がん (IPMN; intraductal papillary mucinous neoplasm; 膵管内乳頭粘液性腫瘍) では後期より短い断片フットプリントが顕著であった。コピー数変異推定においては、大腸がん患者8例10検体を用いた検討でssDNA-LPのPGA (percentage genome altered) scoreがdsDNA-LPより高いctDNA含有率を示したが、一方でMoser et al. (5例の乳・結腸・前立腺がん患者) では有意な差が認められなかったという反論もあり、ssDNA-LPがdsDNA-LPを凌駕するかどうかは依然として議論中である。

uscfDNAのがん検出バイオマーカーとしての可能性:Hudecova et al. はパンがん21例(乳がん・肺がん・胸腺腫・直腸結腸がん・卵巣がん)と健常者28例を比較した際、高ctDNA含有量の検体でuscfDNAの相対量が低下すること、また癌検体でuscfDNA断片のG-カドルプレックス関連配列が減少することを示した。一方、Cheng et al. (本グループ) による末期肺がん14例vs健常者18例の比較ではuscfDNA含有量の増加が観察された。両グループ共通して、特定の機能的エレメントピーク・エンドモチーフ・断片サイズ分布においてがん患者と健常者の差が認められており、uscfDNAは新規バイオマーカーとしての可能性を示している。

他の体液・非ヒト生物への応用:ssDNA-LPは血漿以外の体液でも広く応用されている。唾液cfDNAでは血漿と同様に100bp未満断片の増加と3bp右方シフトが一貫して観察され、口腔がん・唾液腺疾患の非侵襲的検出への応用が期待される。尿cfDNAはssDNA-LPによって100bp未満断片の大幅増加が示され、腎移植モニタリング (移植腎由来ドナーDNA増加; n=10 以上) や膀胱がん早期検出に有用な可能性がある。臓器移植レシピエントの血漿では、細菌・ミトコンドリアDNA割合がssDNA-LPで有意に増加し (p<0.05 vs QiaC法)、感染症・拒絶反応の新たな指標となり得ることが示されている。これらの知見は Mathios et al. NatCommun 2021 等のcfDNA fragmentomics研究と相補的な位置づけにあり、ssDNA-LPが多様な体液・疾患領域にわたるliquid biopsyの方法論的革新をもたらすことを示している。

考察/結論

① 先行研究との違い:従来のdsDNA-LP中心の液体生検研究とは対照的に、本レビューはssDNA-LPが明らかにするcfDNA集団の多様性—特にuscfDNA—を体系的に整理した点で新規な貢献をなしている。Song et al. NatBiomedEng 2022 が指摘するcfDNA解析技術の限界と機会を踏まえ、ssDNA-LPはその補完的技術として位置づけられる。

② 新規性:本論文は、ssDNA-LPに関連するすべての戦略(TdTテーリング・RNAリガーゼ・スプリントアダプター・TACS-TOPO・CLAMP-Seq)を初めて一箇所に体系的にまとめ、uscfDNA研究の現状を俯瞰した初の包括的総説として新規な意義を持つ。また、uscfDNAが生物学的に独立した新規cfDNA亜集団であることを明確に打ち出し、その特性(mncfDNAとの機能的エレメント分布の差異、G-カドルプレックス富化)を多角的に論じている点も革新的である。

③ 臨床応用:早期がん検出においてssDNA-LPが主流のdsDNA-LPを補完・凌駕できるかは今後の大規模比較研究が必要であるが、膵がん112例でのKRAS変異検出率70%・がん特異変異検出率88%という実績はその臨床的可能性を示す。uscfDNAは肺がん・膵がんにおいて健常者との差異が示されており、非侵襲的早期検出ツールとしての開発が期待される。標準化された抽出・ライブラリー調製プロトコルの確立とバイオインフォマティクス解析パイプラインの整備が臨床実装への鍵となる。

④ 残された課題:ssDNA-LPとdsDNA-LPの正確な比較を評価した大規模前向きコホートはまだ存在せず、ssDNA-LPがdsDNA-LPより優れた感度・特異度を持つかどうかは未解決である。uscfDNAの正確な濃度定量法が確立されておらず (血漿中約2.0 ng/ml の推定値のみ)、uscfDNAとmncfDNAの正確な比率評価が困難な点も今後の検討課題である。さらに、ssDNA-LPでは二本鎖duplex情報が失われるためエラー抑制が困難となり、低頻度変異の偽陽性検出リスクがある。今後の検討方向性として、ssDNA-LP専用のUMI設計・in silico エラー抑制モデルの開発、uscfDNAの生物学的起源(関与するヌクレアーゼの同定)の解明、マルチオミクスアプローチとの統合が挙げられる。

方法

本総説はナラティブレビューとして実施された。文献検索はPubMed、MEDLINE、Google Scholar、bioRxivを主要データベースとして用い、主要検索キーワードは「single-stranded library preparation」「cell-free DNA (cfDNA)」「ultrashort single-stranded cfDNA (uscfDNA)」「ssDNA-LP cancer detection」「cfDNA fragmentomics liquid biopsy」「ancient DNA library preparation」とした。対象期間は2010〜2024年1月とし、英語で公表された査読済みの原著論文・レビュー・方法論論文を対象とした。文献選択基準: (1) ssDNA-LPの各ライゲーション戦略を実験的に検証した原著論文、(2) 血漿中uscfDNAの特性をシーケンシングにより確認した実験的研究、(3) dsDNA-LPとssDNA-LPを同一DNA抽出物で比較した比較研究、(4) がん患者コホート (n≥5) においてssDNA-LPまたはuscfDNA解析を実施した臨床研究。各引用研究における統計解析手法(Student t検定・Mann-Whitney U検定・Wilcoxon符号順位検定・Fisher正確検定・Kolmogorov-Smirnov検定等)は原論文の記載を参照した。定量的メタ解析・PRISMA 2020準拠のシステマティックレビューは実施しておらず、著者らの専門的判断に基づく包括的・叙述的統合を採用した。