• 著者: Xubin Chen, Xiaoxuan Meng, Weilong Zhang, Xiawei Zhang, Yaping Zhang, Ping Yang, Yan Liu, Fang Bao, et al.
  • Corresponding author: Junke Zheng, Liping Dou, Hongmei Jing, Aibin He (複数機関)
  • 雑誌: Nature
  • 発行年: 2026
  • Epub日: 2026-03-04
  • Article種別: Original Article
  • PMID: 41781618

背景

血液中の cell-free DNA (cfDNA) は、健常組織および疾患組織の死細胞から放出された断片化クロマチンに由来し、起源組織の分子情報を豊富に保持している。これを活用したリキッドバイオプシーは、出生前診断、移植モニタリング、早期癌検出において臨床的可能性を示してきた (Jahr et al. 2001; Heitzer et al. 2020)。しかし、起源組織の同定が困難なこと、cfDNA量が少量である場合の検出効率の低さ、および遺伝的変異の患者間多様性が広汎な臨床応用を妨げてきた (Phallen et al. 2017; Cristiano et al. 2019)。特に、既存の cell-free クロマチン免疫沈降 (cfChIP) 法はアダプターライブラリー作製をオンビードライゲーションで行うため感度と処理効率に限界があり、H3K4me3一種類のヒストン修飾のみに基づく tissue-of-origin 推定は遺伝子転写との相関を前提とするため疾患特異的クロマチン状態変化を見逃す可能性があった (Sadeh et al. 2021)。この点が未解明のギャップとして残されている。

複数のヒストン修飾を組み合わせた integrated chromatin state (ICS) アプローチは、疾患発症に伴う遺伝子調節機構の変化をより包括的に捉えられると期待されるが、微量血漿サンプルでの高感度自動化プラットフォームはこれまで報告されておらず、この点で技術的な課題が残されていた。また、既存の cfDNA ベースの診断法では、疾患の早期検出、サブタイプ分類、治療応答予測において、その精度と網羅性が不足しているという課題があった。本研究は、これらの課題を克服し、より高感度で網羅的なエピゲノム解析を可能にする新規プラットフォームの開発を目指した。

目的

本研究では、微量の血漿 cfDNA から複数のヒストン修飾を高感度かつ自動化・高スループットでプロファイリングする cf-EpiTracing プラットフォームを開発し、以下の多様な臨床シナリオへの適用可能性を実証することを目的とした。(1) ICSを用いた疾患発生起源組織の同定、(2) 疾患サブタイプの非侵襲的分類、(3) 早期病変・早期疾患の検出、(4) 治療応答と予後の予測。具体的には、大腸癌 (CRC)、冠動脈疾患 (CHD)、B細胞リンパ腫 (DLBCL, FL, MCL) などの疾患において、cf-EpiTracingが既存の臨床指標を上回る診断・予後予測性能を持つことを示すことを目指した。

結果

cf-EpiTracingのプラットフォーム性能: cf-EpiTracingは50-200 μLの血漿で高いピーク精度を達成し (AUC 0.77-0.95)、25 μLのサンプルでは精度が低下した (Fig. 1b)。健常者血漿へのスパイクイン実験では、わずか0.005 ng相当の外来クロマチンが確実に検出され、高い感度を示した (Fig. 1c,d)。8種のヒストン修飾 (H3K4me1/me2/me3、H3K9ac、H3K27ac、H3K36me3、H3K27me3、H3K9me3) の中でH3K4me3・H3K9ac・H3K27acの3種の組み合わせが最も高い組織分類性能を示し (NMI 0.87, ARI 0.82)、6種全体との差がないことが確認された (Fig. 2c)。Tn5タグメンテーション由来の断片は中央値123 bpと、通常cfDNA (~170 bp) よりも短く、サブヌクレオソームパターンを示した。同一サンプルでの対比較ではcfChIPよりcf-EpiTracingの方が高い性能を示した。

疾患発生起源の同定: GLM分類器はCRC (AUC = 0.965; 感度 0.864; 特異度 0.924)、CHD (AUC = 0.971; 感度 0.800; 特異度 0.963)、B細胞リンパ腫 (AUC = 0.963; 感度 0.839; 特異度 0.962) を健常者から高精度で識別した (Fig. 3b)。組織エンリッチメントスコアにより各疾患のprimary組織シグネチャーが特異的に上昇し (CRC: 結腸直腸、CHD: 心臓、リンパ腫: リンパ球)、さらに続発性関与臓器 (CRCの肝転移候補、リンパ腫の脾臓・膵臓等) のシグネチャーも予測されることが示され、臨床情報との一致が確認された (Fig. 3d,e)。IBDとCRCはいずれも大腸由来のシグネチャーを示すがcf-EpiTracingで相互に識別可能であった。

大腸癌の早期検出と予後層別化: 747個のCRC特異的ICSを特徴量としたXGBoost分類モデルは、訓練群で正解率0.976、独立した検証群で正解率0.922を達成した (Fig. 4d,e)。前癌病変 (CRA) 患者の77.27%がCRC患者側に分類され、CRA検出の真検出率としてCEA・CA125を大幅に上回った (Fig. 4f,g)。CRCをCRC-1とCRC-2の2サブグループに分類し、発見・検証データセット双方でCRC-1が有意に高い疾患進行リスクを示した (Kaplan-Meier解析、log-rank p値で有意) (Fig. 4i)。

B細胞リンパ腫のサブタイプ分類: DLBCL・FL・MCLは各サブタイプ特異的ICSを用いた多クラス分類でmulti-class AUC = 0.823を達成した (Fig. 5d)。DLBCLのGCB vs non-GCBサブタイプ分類では、ICSベースの分類精度93.22%がRNA-seq由来の遺伝子発現プロファイルを用いた分類 (89.76%) を上回った (Extended Data Fig. 8g-i)。また、僅か1%のDLBCL血漿をスパイクインした実験でもB細胞由来シグネチャーが検出可能であり、プラットフォームの高感度性が実証された (Extended Data Fig. 8d)。転座型FL (tFL) の6患者15サンプルのpseudo-time解析では、FLからDLBCLへの変換過程の中間状態が同定され、26個の転換関連ICS (IL17RD、TCF7L2等) とBCL6・MYCの転写因子モチーフ濃縮が変換過程とともに増加することが示された (Fig. 5g,h,i)。

DLBCLの早期発見と再発リスク予測: DLBCLのステージ別分類ではmulti-class AUC = 0.942が得られ、早期ステージ (I/II) 正解率0.78・進行ステージ (III/IV) 正解率0.89・健常者正解率0.85を達成した (Fig. 5k)。DLBCL再発リスク予測では、141名 (27イベント) のCox解析でBonferroni補正後に5つのICSマーカー (WRNIP1.ICS13、VCL.ICS14、KHDRBS1.ICS15、PLEKHD1.ICS6、SERPINB1.ICS17) が再発リスクと有意に関連した (Fig. 5l)。これらICSマーカーによる高リスク・低リスク層別化は、IPI等の既存臨床指標では有意差が得られなかったのに対し、発見・検証コホート双方で有意な全生存期間の差を示した (Fig. 5m)。

MCLの遺伝的・後成的解析: MCL特異的t(11;14)転座イベントがcf-EpiTracingデータから同定可能であり、CCND1遺伝子座周辺のH3K4me3・H3K9ac等の活性化ヒストン修飾の増加が転座スコアと有意に相関した (Extended Data Fig. 10b-d)。MCL特異的ICSの大部分はエンハンサー領域に集中しており、MCLリンパ腫形成においてエンハンサーのクロマチン変化が支配的な後成的応答であることが示唆された (Extended Data Fig. 10e)。

考察/結論

先行研究との違い: 本研究で開発したcf-EpiTracingプラットフォームは、既存のcfChIP法と比較して、より微量の血漿 (50 μLから) から複数のヒストン修飾を高感度かつ自動化・高スループットでプロファイリングできる点で優れている。従来のcfChIP法がオンビードライゲーションに依存し、H3K4me3単独の解析に限定されていたのに対し、本手法はTn5トランスポザーゼタグメンテーションと複数のヒストン修飾の統合解析 (ICS) を採用することで、疾患の起源同定、サブタイプ分類、早期検出、予後予測において既存の臨床指標を上回る性能を示した点で対照的である。

新規性: 本研究で初めて、血漿cfDNAから複数のヒストン修飾を網羅的にプロファイリングする自動化プラットフォームcf-EpiTracingを開発した。この技術は、大腸癌、冠動脈疾患、B細胞リンパ腫において、疾患の発生起源の同定、サブタイプ分類、早期検出、予後予測において既存の臨床指標を上回る性能を示した。特に、大腸癌の早期病変検出で77.27%の検出率を達成し、リンパ腫のサブタイプ分類では93.22%の精度を示したことは、これまで報告されていない新規な知見である。また、転座型FLからDLBCLへの変換過程におけるエピジェネティックな変化や、MCLにおける遺伝的転座とヒストン修飾の同時解析も本研究で初めて詳細に示された。

臨床応用: cf-EpiTracingは、非侵襲的なリキッドバイオプシーとして、早期診断、分子サブタイピング、予後予測といった幅広い臨床応用への可能性を秘めている。特に、前癌病変の検出や、既存の臨床指標では層別化が困難であったリンパ腫患者の再発リスク予測において、その臨床的有用性が示された。これにより、個別化医療の推進や、治療戦略の最適化に貢献できると期待される。

残された課題: 今後の検討課題として、cf-EpiTracingによって検出される断片サイズが通常cfDNAよりも短い (中央値123 bp) ことによるフラグメントミクス特徴の損失や、ATAC-seq (Assay for Transposase-Accessible Chromatin with high-throughput sequencing) で報告されているようなシーケンスバイアスの補正が必要である。また、cf-EpiTracingを他のcell-freeモダリティ (DNAメチル化、変異、トポロジーなど) と統合することで、より複雑な疾患の診断精度を向上させる可能性も残されている。大規模な患者コホートでのさらなる検証と、臨床現場への導入に向けた標準化が今後の方向性である。

方法

プラットフォーム開発: cf-EpiTracingはBiomek i5自動ワークステーション上で実装された。ヒストン修飾特異的抗体(例:抗H3K4me3抗体 (Diagenode C15200152))を常磁性ビーズに共有結合させ、血漿25-200 μLからcell-freeクロマチンを捕捉した。バッチ効果・サンプル変動の補正のため、各サンプルに軽度固定化したDrosophila S2細胞由来クロマチンをスパイクインした。DNA断片のライブラリー化には、オンビードライゲーションに代わり、バーコード化アダプターを組み込んだTn5トランスポザーゼタグメンテーションを採用した。抗体インキュベーション後4-12時間以内に96ウェルプレートで多検体並行処理を完結させた。ライブラリーはDNBSEQ-T7プラットフォームでペアエンド150bpリードでシーケンスされた。

ICSの定義: BLUEPRINT、Roadmap Epigenomics、ENCODEプロジェクトの65組織・初代細胞のChIP-seqデータ (7種ヒストン修飾) を用いてChromHMMで18-ICSモデルを訓練した。組織特異的ICSシグネチャーを定義し、各組織・細胞種のゲノム領域との対応を確立した。下流解析では、H3K4me3、H3K9ac、H3K27acの3種類のヒストン修飾で明確に識別可能な10種類のICS (ICS6, ICS7, ICS9, ICS12-18) を優先的に使用した。

コホート: 健常者 (n=125)、炎症性腸疾患 (IBD)、大腸癌 (CRC; n=107)、冠動脈疾患 (CHD; n=23)、B細胞リンパ腫 (n=309: DLBCL n=170、FL n=65、MCL n=74) の計2,417サンプルでcf-EpiTracingプロファイルを作成した。CRCでは大腸腺腫 (CRA; 前癌病変) n=22も解析対象とした。発見コホートと独立した検証コホートを設けた。倫理委員会承認 (Peking University Third Hospital S2024679など) を得て、インフォームドコンセントを取得した。

解析: 疾患分類にはgeneralized linear model (GLM) およびXGBoost機械学習を用いた。リンパ腫のサブタイプ分類と病期判定にはICSに基づく階層クラスタリングおよびXGBoostを使用した。DLBCLの治療応答・再発リスク予測には多変量Cox比例ハザード解析を行った。MCLではcf-EpiTracingデータから染色体転座 (t(11;14)) イベントとヒストン修飾の同時解析を試みた。統計解析にはRパッケージDESeq2、fitdistrplus、Seurat、Survminer、Survivalが用いられた。ROC曲線、AUC、感度、特異度、NMI、ARIを用いて性能を評価した。