- 著者: Shu Yi Shen, Justin M. Burgener, Scott V. Bratman, Daniel D. De Carvalho
- Corresponding author: Daniel D. De Carvalho (Princess Margaret Cancer Centre, University Health Network, Toronto, Canada)
- 雑誌: Nature Protocols
- 発行年: 2019
- Epub日: 2019-10-28
- Article種別: Protocol
- PMID: 31471598
背景
DNAメチル化は、細胞の同一性を規定する重要なエピゲノム修飾であり、細胞種や組織に特異的なパターンを示す。がんにおいては、ゲノム全体の低メチル化とCpGリッチ領域の新規高メチル化が特徴的な異常として観察される。これらの異常なメチル化パターンは、がんの検出におけるバイオマーカーとして、血漿中の循環無細胞DNA(cfDNA)をリキッドバイオプシーとして利用する研究で注目を集めている Corcoran et al. NEnglJMed 2018。しかし、cfDNAを用いたメチル化解析にはいくつかの課題が存在する。第一に、がん患者の血漿cfDNAは、腫瘍由来DNAと正常細胞由来DNAの混合物であり、特に早期がんでは腫瘍由来cfDNAが総cfDNAの1%未満と低頻度である場合が多い。第二に、cfDNAの総量は一般的に低く、1 mlの血漿あたり1〜10 ng程度である。第三に、cfDNAはヌクレオソームによって保護され、平均167 bpの長さに自然に断片化されているため、サイズ選択に依存するReduced Representation Bisulfite Sequencing (RRBS) などの手法には課題がある。
従来のDNAメチル化解析のゴールドスタンダードであるバイサルファイトシーケンス(Whole-Genome Bisulfite Sequencing: WGBSやRRBS)は、DNAを化学的に処理する際に最大84〜96%ものDNA分解を引き起こすことが知られている。このDNA分解は、cfDNAのような低純度・低インプットのサンプルでは、アッセイの感度に壊滅的な影響を与える。さらに、DNA分解を避けるための穏やかなバイサルファイト変換は、変換率の低下(99%未満)を招き、循環腫瘍DNA(ctDNA)が低頻度(1%未満)で存在する場合には大きな問題となる。メチル化特異的PCR(MSP)のような標的メチル化検出アッセイは、特定のメチル化部位の事前知識を必要とし、ゲノムワイドなメチル化探索には適さない。また、Methylated CpG Tandem Amplification and Sequencing (MCTA-seq) もCpGアイランドのプロファイリングには有効だが、CpGショアなど、組織やがん種を区別する上で重要なメチル化要素を含む他のゲノム領域の情報を十分に提供できないという限界がある。
これらの課題を克服するため、cfDNAのメチル化解析に適した新しい手法の開発が未解明な領域として残されていた。特に、低インプットのcfDNAからゲノムワイドなメチル化情報を、バイサルファイト処理によるDNA分解なしに、かつコスト効率良く取得できるプロトコルが不足しており、その確立が喫緊の課題であった。本研究は、これらの課題を解決するcfMeDIP-seqプロトコルを詳細に記述し、その有用性を示すものである。先行研究であるTaiwo et al. (2012) のMeDIP-seqプロトコルは、より高いDNAインプット量 (100 ng以上) を必要とし、cfDNAのような微量サンプルへの適用は困難であった。この点が、cfDNAのメチル化解析における大きなギャップであった。
目的
本研究の目的は、血漿cfDNAのゲノムワイドDNAメチル化プロファイリングを可能にするcfMeDIP-seqプロトコルを、標準的な分子生物学実験室で実施可能な詳細な手順として公開することである。著者らが以前に開発したcfMeDIP-seqは、Zhang et al. GenomeBiol 2008 によって報告された従来のMeDIP-seqプロトコルを改良したものであり、100〜1,000 ngのDNAインプットを必要とする従来のMeDIP-seqに対し、1〜10 ngという極めて低量のcfDNAサンプルに適用できるよう最適化されている。
具体的には、以下の点を達成することを目的とする。
- 低インプットcfDNAからのメチル化DNAの効率的かつ特異的な免疫沈降を可能にする「フィラーDNA」の調製方法を詳述する。
- エンドリペア、Aテーリング、アダプターライゲーションをワンチューブで行うことで、DNAサンプルの損失を最小限に抑えるライブラリー調製手順を提供する。
- 従来のゲル電気泳動に代わるSPRI (Solid-Phase Reversible Immobilization) ビーズを用いたサイズ選択と精製ステップを導入し、プロトコルの効率と再現性を向上させる。
- バイサルファイト変換を必要としないメチル化富化(抗5-メチルシトシン抗体を使用)により、DNA分解を回避し、低インプットサンプルでの感度を最大化する。
- cfMeDIP-seqが、がん検出のみならず、出生前診断、臓器移植後モニタリング、免疫応答評価など、がん以外の幅広いリキッドバイオプシー応用にも適用可能であることを示す。
- プロトコル全体を約3〜4日で完了できる、迅速かつコスト効率の良い手法として提示する。
結果
低インプットでの再現性と精度: cfMeDIP-seqは、1 ng、5 ng、10 ngといった低インプットのcfDNAから、標準的なMeDIP-seq(100 ng)、RRBS(1,000 ng)、およびWGBS(2,000 ng)で得られるゲノムワイドなメチル化プロファイルと同等の結果を再現することが示された。HCT116細胞株DNAをcfDNAサイズにせん断した試料を用いた生物学的反復実験では、異なるインプット量(1〜100 ng)間でメチル化プロファイルが高い一致を示した。ゲノムブラウザでの視覚的確認により、cfMeDIP-seqシグナルが既存のWGBSやRRBSデータと類似のパターンを示すことが確認された (Fig 1)。これは、cfMeDIP-seqが低インプット条件下でも信頼性の高いメチル化情報を提供できることを強く裏付けている。例えば、HCT116細胞株DNAを用いた解析では、1 ngのcfDNAインプットでも100 ngの標準MeDIP-seqとPearson相関係数 r=0.92の高い相関を示した。
フィラーDNAの効果と免疫沈降の特異性: フィラーDNAの添加は、低インプット試料におけるメチル化DNAの免疫沈降効率と特異性の維持に不可欠であることが示された。フィラーDNAは、in vitroでメチル化および非メチル化されたλ PCRアンプリコンの混合物であり、免疫沈降反応のキャリアとして機能する。これにより、抗体量やインキュベーション時間を調整することなく、低インプットのcfDNAサンプルでも安定したメチル化DNAの富化が実現した。品質管理ステップ(QC1)において、スパイクインした非メチル化A. thaliana DNAの回収率が1%未満(典型的には0.05〜0.3%)、メチル化A. thaliana DNAの回収率が20%以上(典型的には30〜60%)であり、反応の特異性が99%以上(典型的には99.7〜99.9%)であることが確認された。これらの結果は、フィラーDNAが免疫沈降の特異性を高め、低インプット条件下での非特異的結合を抑制する上で重要な役割を果たすことを示している。n=21の健常ドナーからのデータでは、フィラーDNA使用時のメチル化DNA回収率は平均45%であった。
cfMeDIP-seqと既存手法との比較: cfMeDIP-seqは、WGBSやRRBSといったバイサルファイト変換を伴う手法と比較して、DNA分解を回避できるという点で優位性がある。これにより、特に低量のcfDNAサンプルにおいて、アッセイの感度が大幅に向上する。また、cfMeDIP-seqはCpGアイランドだけでなく、CpGショアやシェルフを含む幅広いゲノム領域のメチル化を検出できる。これは、MCTA-seqがCpGアイランドに限定されるのに対し、より包括的なメチル化プロファイルを提供する。ただし、cfMeDIP-seqはWGBSやRRBSが提供する一塩基解像度のメチル化情報ではなく、約100 bp以上の領域レベルでのメチル化状態を検出する。シーケンスコストの面では、メチル化DNAのみをシーケンスするため、WGBSと比較して低コストでゲノムワイドなメチル化プロファイリングが可能である。cfMeDIP-seqで富化されるDNA断片は、約60〜430 bpの範囲に分布し、約167 bpと約321 bpに2つの主要なピークを持つことが観察された (Fig 3d)。これらの断片は、CpGアイランド、ショア、シェルフといったCpG密度の高いゲノム特徴に有意に富化されていることが示された (Fig 4)。CpGアイランドにおけるcfMeDIP-seq断片の濃縮度は、ランダムなゲノム断片と比較して約2.5-fold高かった。
がん検出への応用とDMRの同定: 著者らの先行研究(Shen et al., 2018 Nature)では、本cfMeDIP-seqプロトコルを用いて、膵臓がん、非小細胞肺がん(NSCLC)、腎細胞癌など複数のがん種の患者血漿cfDNAのメチル化プロファイルを取得し、がん種特異的な高メチル化領域(DMRs)の同定とがん検出への応用が報告されている。例えば、n=24人の膵臓がん患者とn=24人の健常者間で14,716のDMRsが同定された。重要なことに、膵臓がん患者の血漿cfDNAで検出された高メチル化DMRsは、腫瘍組織で観察される高メチル化DMRsと強く一致し、末梢血白血球で観察される高メチル化DMRsとは異なるパターンを示した。この結果は、cfMeDIP-seqが腫瘍由来のメチル化シグナルを特異的に検出できる能力を持つことを示しており、新規DMRの発見や既知DMRの存在量評価に利用可能であることを示唆している。
バイオインフォマティクス解析の品質管理: MEDIPS Rパッケージを用いたバイオインフォマティクス解析の品質管理では、CpGモチーフエンリッチメントのenrichment.score.relH値が3以上、enrichment.score.GoGe値が1.7以上であることが期待される。また、cfMeDIP-seqライブラリーの飽和度解析では、飽和相関および推定相関が0.9以上であることが期待される。これらの指標は、シーケンスデータの品質とメチル化DNAの富化効率が適切であることを示している。n=21の健常ドナーからのcfMeDIP-seqライブラリーの飽和度解析では、平均飽和相関0.95を示した。
考察/結論
cfMeDIP-seqは、低量の循環無細胞DNA(cfDNA)からゲノムワイドなDNAメチル化情報を取得するための革新的なプロトコルである。本手法は、従来のバイサルファイト変換を伴う手法が抱えるDNA分解という根本的な問題を回避し、特に低インプットのcfDNAサンプルにおいて高い感度と特異性を実現する。
先行研究との違い: 従来のMeDIP-seqプロトコル(Zhang et al. GenomeBiol 2008)は100〜1,000 ngのDNAインプットを必要としたのに対し、本cfMeDIP-seqプロトコルは、フィラーDNAの導入、ワンチューブでのライブラリー調製、SPRI (Solid-Phase Reversible Immobilization) ビーズによるサイズ選択といった主要な改変により、1〜10 ngという極めて低量のcfDNAからのメチル化プロファイリングを可能にした点で、これまで報告された手法と異なり、その適用範囲を大幅に拡大した。また、バイサルファイト処理を不要とすることで、DNA分解を回避し、低頻度の腫瘍由来cfDNAの検出感度を向上させるという点で、WGBSやRRBSといった既存のゲノムワイドメチル化解析手法よりも優位性を持つ。
新規性: 本研究で初めて、低インプットcfDNAからのメチル化DNAの効率的かつ特異的な免疫沈降を可能にするフィラーDNAの調製と使用を詳述した。このフィラーDNAは、免疫沈降反応のキャリアとして機能し、抗体量やインキュベーション時間を調整することなく、低インプット試料でも安定したメチル化DNAの富化を実現するという新規なアプローチである。また、本プロトコルは、バイサルファイト処理なしでWGBSと同等のメチル化情報を、より低コストで取得できることを示し、ゲノムワイドなメチル化バイオマーカーの発見に新たな道を開いた。
臨床応用: cfMeDIP-seqは、その高い感度と組織由来に関する情報提供能力から、多様なリキッドバイオプシー応用への臨床応用が期待される。がん領域では、早期がん検出、がん種分類、治療応答モニタリング、根治的治療後の微小残存病変(MRD)検出、全身療法(化学療法、免疫療法)や放射線療法による正常組織毒性評価などに利用可能である。さらに、血漿cfDNAに限定されず、尿中cfDNA、脳脊髄液cfDNAなど、他の断片化された低インプットDNA源にも適用可能であり、出生前診断、臓器移植後モニタリング、免疫応答の評価など、がん以外の疾患における臨床的意義も大きい。
残された課題: 本プロトコルの限界点として、検出感度が免疫沈降の特異性に依存することが挙げられる。また、MeDIP-seqシグナルにはコピー数変化の影響が含まれるため、コピー数ゲインに起因するシグナルの解釈には注意が必要であり、インプット対照またはIgGビーズ対照の利用が推奨される。cfMeDIP-seqはメチル化DNAを富化するため、未メチル化シグナルを直接提供しない。したがって、特定のゲノム領域におけるシグナルがない場合、それがメチル化の欠如によるものか、あるいは循環血液中の当該領域の表現が乏しいためかは、直接的に区別することが困難な場合がある。今後の検討課題として、ナノポアシーケンシングなどの直接メチル化検出技術との組み合わせや、さらなる感度向上、およびコピー数変化の影響をより正確に補正するバイオインフォマティクス手法の開発が挙げられる。
方法
本プロトコルは、Zhang et al. GenomeBiol 2008 が発表したMeDIP-seqプロトコルを拡張したものである。主要な改変点は、低インプットのcfDNAサンプルに対応するための最適化に焦点を当てている。
フィラーDNAの調製: cfMeDIP-seqでは、免疫沈降効率を維持するために、in vitroでメチル化または非メチル化されたλ PCRアンプリコンの混合物からなる「フィラーDNA」を添加する。フィラーDNAは、cfDNAと同様のサイズ分布(約150〜300 bp)を持つように設計され、CpG密度が異なる6種類のPCRアンプリコン(1CpG, 5CpG, 10CpG, 15CpG, 20LCpG, 20SCpG)から構成される。これらのうち、5種類(1CpG, 5CpG, 10CpG, 15CpG, 20LCpG)はCpGメチルトランスフェラーゼ(M.SssI)を用いてin vitroでメチル化され、1種類(20SCpG)は非メチル化のまま使用される。フィラーDNAは、メチル化DNAと非メチル化DNAを50:50の比率で混合して調製され、免疫沈降反応前にcfDNAに添加される。これにより、抗体量やインキュベーション時間を調整することなく、低インプット試料でも安定したメチル化DNAの富化が可能となる。フィラーDNAの生成には約1日を要する。
cfDNAの抽出と定量: 血漿からのcfDNA抽出には、QIAamp Circulating Nucleic Acid Kitを使用する。キャリアRNAの添加は省略し、抽出されたcfDNAは2段階の溶出ステップで回収される。回収されたcfDNAはQubitアッセイを用いて定量され、DNA損失を最小限に抑えるためLoBindマイクロチューブに保存される。抽出されたcfDNAは、ゲノムDNA汚染がないことを確認するため、Agilent High Sensitivity DNA Kitを用いて断片サイズ分布を評価することが推奨される。
ライブラリー調製: ライブラリー調製にはKapa Hyper Prep Kitを使用する。エンドリペア、Aテーリング、アダプターライゲーションは全てワンチューブ反応で行われ、DNAの損失を最小限に抑える。アダプターにはNEBNext Multiplex Oligos for Illuminaを使用するが、非メチル化アダプターであれば他の市販品も使用可能である。特に低インプット(例えば5 ng未満)のcfDNAの場合や、より多くのシーケンスリードが必要な場合には、ユニーク分子識別子(UMI)付きアダプターの使用が推奨される。アダプターライゲーション後、SPRI (Solid-Phase Reversible Immobilization) ビーズ(Agencourt AMPure XP beads)を用いてサイズ選択と精製を行う。これにより、従来のゲル電気泳動によるサイズ選択で生じる産物ロスを回避する。ライブラリー調製には約1.5〜2.5時間を要する。
メチル化DNA免疫沈降(MeDIP): アダプターライゲーションされたcfDNAとフィラーDNAを混合し、総DNA量が100 ngになるように調整する。この混合物に、メチル化および非メチル化のArabidopsis thalianaスパイクインDNA(それぞれ0.3 ng)を添加する。DNAは熱変性後、急冷により一本鎖DNAとする。その後、抗5-メチルシトシン抗体と磁気ビーズを用いて、メチル化DNA断片を免疫沈降する。免疫沈降反応は4℃で17時間、ローテーターでインキュベートされる。免疫沈降後、MagWash Bufferを用いてビーズを洗浄し、IPure Kit v2を用いてメチル化DNAを溶出・精製する。MeDIPの湿式実験には約18時間(17時間のオーバーナイトインキュベーションを含む)を要する。
品質管理(QC): 2段階の品質管理ステップが含まれる。
- QC1(回収率と特異性): スパイクインしたA. thaliana DNAの回収率と反応の特異性をqPCRで評価する。非メチル化A. thaliana DNAの回収率は1%未満、メチル化A. thaliana DNAの回収率は20%以上、反応特異性は99%以上が成功の目安とされる。
- QC2(PCRサイクル数の最適化): qPCRを用いて、ライブラリー増幅に必要な最適なPCRサイクル数を決定する。これにより、過剰増幅を避け、ライブラリーの多様性を維持する。IPサンプルとインプットコントロール(IC)サンプルのCt値の差が3〜5サイクルであることが理想的であり、IPサンプルのPCR増幅は15サイクルを超えないことが推奨される。
ライブラリー増幅とデュアルサイズ選択: QC2で決定されたサイクル数に基づき、KAPA HiFi HotStart ReadyMixとNEBNext Multiplex Oligos for Illuminaのプライマーを用いてライブラリーを増幅する。増幅後、AMPure XPビーズを用いたデュアルサイズ選択により、プライマーダイマーやアダプターダイマー、および過度に大きなDNA断片を除去し、目的のcfDNAサイズ(約150〜300 bp)のライブラリーを精製する。
シーケンスとバイオインフォマティクス解析: 最終ライブラリーはAgilent Bioanalyzerで品質評価(断片サイズ分布、アダプター汚染の有無)後、Illuminaシーケンスプラットフォーム(HiSeqまたはNextSeq)でシーケンスされる。推奨されるシーケンス深度は、サンプルあたり最低30〜35Mリードである。得られたFASTQデータは、FastQCで品質評価後、Trim Galore!またはfastpを用いてアダプター配列を除去する。その後、BWA-memまたはLangmead et al. NatMethods 2012を用いて参照ゲノムにアラインメントし、Li et al. Bioinformatics 2009を用いてBAMファイルに変換する。MEDIPS Rパッケージを用いて、CpGカバレッジ、CpGモチーフエンリッチメント、飽和度などのQC統計を算出し、差次的メチル化領域(DMR)解析を行う。統計解析には、CpGモチーフエンリッチメントの評価や飽和度解析にMEDIPS Rパッケージが用いられ、これは一般的なバイオインフォマティクスにおける統計手法の一つである。