- 著者: Dai Shimizu, Kenzui Taniue, Yusuke Matsui, Hiroshi Haeno, Hiromitsu Araki, Fumihito Miura, Mitsuko Fukunaga, Kenji Shiraishi, Yuji Miyamoto, Seiichi Tsukamoto, Aya Komine, Yuta Kobayashi, Akihiro Kitagawa, Yukihiro Yoshikawa, Kuniaki Sato, Tomoko Saito, Shuhei Ito, Takaaki Masuda, Atsushi Niida, Makoto Suzuki, Hideo Baba, Takashi Ito, Nobuyoshi Akimitsu, Yasuhiro Kodera, Koshi Mimori
- Corresponding author: Dai Shimizu (Nagoya University Graduate School of Medicine); Kenzui Taniue (University of Tokyo, Isotope Science Center; Genomedia Inc.)
- 雑誌: Cancer Gene Therapy
- 発行年: 2022
- Epub日: 2021-10-21
- Article種別: Original Article
- PMID: 34744163
背景
癌の正確かつ早期の診断と組織起源分類は、適切な治療選択と癌関連死亡率の低減に不可欠である。しかし、組織学的・病理学的診断では原発巣の特定が困難な場合があり、診断の不確実性が治療方針の決定と予後に悪影響を及ぼすことが課題であった。特に、原発不明癌 (CUP; Cancer of Unknown Primary) は全癌の3-5%を占め、第7-8位の頻度の悪性腫瘍であり、癌死の第4位の原因でもある。詳細な検査後も組織学的・免疫組織化学的手法では原発巣を同定できない本疾患は、予後が著しく不良であり (中央生存期間6-12か月)、原発巣に応じた分子標的治療の適用が困難であるという深刻な臨床的課題が存在する。
DNAメチル化は組織特異的・腫瘍特異的なパターンを持ち、癌化後もある程度維持されるため、癌細胞の起源 (CCO; cancer cell of origin) 同定に利用できる可能性が指摘されている (Jaenisch and Bird 2003; Esteller 2008; Jones and Baylin 2007)。先行研究では、DNAメチル化が癌の分子特性評価に有用なバイオマーカーとなり得ることが示されている (Hao et al. 2017; Witte et al. 2014; Ding et al. 2019)。また、cfDNAメチル化は、肝臓癌、大腸癌、腎臓癌を含むいくつかの癌種の診断、サーベイランス、予後予測に利用できることが報告されている (Xu et al. 2017; Luo et al. 2020; Nuzzo et al. 2020; Shen et al. 2018; Liu et al. 2018)。しかし、これまでの研究では、対象癌種が限定的であったり、組織生検のみで液体生検への応用が未検討であったり、使用したメチル化解析プラットフォームが単一であったりという限界があった。例えば、Liu et al. (2019) は深層学習を用いて汎癌種診断のためのDNAメチル化マーカーを同定したが、その適用範囲は限定的であった。また、大規模な多癌種メチル化データベースであるTCGA (The Cancer Genome Atlas) の登場により、より多くの癌種をカバーする実用的な汎癌種 (pan-cancer) 分類パネルの開発が可能となったが、27癌種を包括し組織・液体生検の両方に応用可能なパネルの体系的構築は未開拓であり、この点に大きな知識ギャップが残されている。
さらに、腫瘍内不均一性 (ITH; intratumor heterogeneity) は癌の診断と治療において重要な課題であり、腫瘍が異なる遺伝的・表現型的特徴を持つ不均一な細胞集団で構成されていることが知られている (Lawson et al. 2018; McGranahan et al. Cell 2017; Turajlic et al. 2019; Reiter et al. NatRevCancer 2019)。DNAメチル化パターンがITHにどの程度頑健であるか、また異なるメチル化解析プラットフォーム間での互換性も、臨床応用を考慮する上で重要な検討課題として残されていた。これらの課題を克服し、非侵襲的な癌診断と組織起源同定を可能にする汎癌種メチル化パネルの開発が強く求められている。
目的
本研究の目的は、TCGA (The Cancer Genome Atlas) の網羅的DNAメチル化データを解析し、28癌種に対応する癌特異的高メチル化シトシンを同定することで、汎癌種診断・組織起源分類 (CACO; Classification of Cancer cell of Origin) パネルを開発することである。具体的には、以下の点を検証する。
- TCGAの発見コホートおよび独立検証コホートにおいて、CACOパネルの癌診断および組織起源分類における高い感度と特異度を評価する。
- HumanMethylation450K (HM450K)、HumanMethylationEPIC (EPIC) アレイ、およびビスルファイトシーケンシング (tPBAT-WGBS) の複数プラットフォーム間でのCACOパネルの互換性を検証する。
- 大腸癌患者の多領域サンプルを用いて、CACOパネルが腫瘍内不均一性 (ITH) の影響を受けずに組織起源を正確に同定できるか評価する。
- 乳癌、大腸癌、肺癌患者および原発不明癌 (CUP) 患者の血漿cfDNAにCACOパネルを適用し、リキッドバイオプシーによる非侵襲的な癌診断および組織起源推定の可能性を実証する。
これらの検証を通じて、CACOパネルが臨床現場における癌の早期診断、組織起源同定、およびCUP患者の治療選択に貢献する強力なツールとなり得ることを示すことを目指す。
結果
ディスカバリーコホートでのCACOパネル性能: 27癌種パネルのディスカバリーデータにおける最高AUCは0.998 (UVM; ぶどう膜メラノーマ)、最低AUCは0.856 (THYM; 胸腺癌) であった (Supplementary Fig. S2, Supplementary Table S1)。全27癌種でAUC>0.85を達成し、癌種別に高い識別能が示された。各癌種特異的パネルのメチル化スコア分布は、対応する癌種で際立って高い値を示し、他の癌種との識別性が明確であった。ただし、UCS (子宮癌肉腫) やUVM (ぶどう膜メラノーマ) パネルでは一部の他癌種が偽陽性となりやすいことも確認され、癌種ごとの閾値設定の重要性が示された (Supplementary Fig. S5)。閾値設定後、CACOパネルはディスカバリーコホートで高い感度と特異度を示した (Fig. 2a, Supplementary Table S4)。
独立検証コホートでのCACOパネル性能: 独立検証セットでの最高AUCは1.000 (DLBC; びまん性大細胞型B細胞リンパ腫)、最低AUCは0.854 (LUSC; 肺扁平上皮癌) であった (Supplementary Fig. S3, Supplementary Table S1)。全27癌種において高い分類精度が維持されており、発見コホートとほぼ同等のパフォーマンスが確認され、過学習なく汎化性能が示された。感度・特異度のバランスも各癌種で高い水準を維持した (Fig. 2b, Supplementary Table S4)。ヒートマップ解析では、CACOパネルが発見コホートおよび検証コホートの両方で27癌種と健常全血を明確に分類できることが示された (Fig. 1b, c)。
日本人コホートでのEPICプラットフォーム互換性検証: HM450Kアレイで構築されたCACOパネルを、日本人患者コホートのEPICアレイデータに適用した結果、BRCA (AUC 0.988)、COADREAD (AUC 0.879)、STAD (AUC 0.990) と全3癌種で高い分類精度が得られた (Fig. 3d)。ヒートマップ解析でも各癌種特異的パネルが正確な組織起源分類を示し、t-SNE解析も3癌種を明確に分類した (Fig. 3a-c)。この検証にはn=16 patientsの乳癌、n=16 patientsの大腸癌、n=16 patientsの胃癌組織が使用された。これは、CACOパネルが異なる民族的・地理的背景を持つコホートや異なるマイクロアレイプラットフォーム間でも互換性を持つことを実証する重要な知見である。
tPBAT-WGBSによるビスルファイトシーケンシングデータ検証: COADREAD9患者の原発・転移サンプルのtPBAT-WGBSデータにCACOパネルを適用したところ、TCGA検証コホートのβ値スコアと強い線形相関が確認された (Supplementary Fig. S9)。ヒートマップ解析では、全15サンプル (原発+転移) 中でCOADREADパネルスコアが最高値を示し、原発サンプルは100% (9/9例)、転移サンプルは66.7% (6/9例) がCOADREADとして正確に分類された (肺・肝・リンパ節転移を含む) (Fig. 4, Supplementary Fig. S10)。転移サンプルでの低い正解率は、腫瘍純度が低い検体の混入が原因である可能性が示唆された。
腫瘍内不均一性への頑健性: 8 COADREAD患者の多領域サンプル解析では、97.0% (64/66) の原発領域サンプルと全転移サンプルがCOADREADとして正確に識別された (Fig. 5)。同一患者の正常隣接組織は非悪性として正確に分類され、肝転移サンプルもLIHC (肝細胞癌) とは分類されなかった。この結果は、CACOパネルがITHの影響を受けず、単一生検から正確な診断が可能であることを示す。
cfDNAからの組織起源推定: 癌患者血漿cfDNAへのCACOパネル適用では、BRCA 3/3例 (100%) およびCOADREAD 3/4例 (75%) で正確な組織起源分類が得られた (Fig. 6a)。一方、肺癌 (LUAD/LUSC) は4例中1例 (25%) のみ正確に分類された。肺癌での低い正解率は、血漿中の腫瘍由来cfDNA (genome equivalent) が乳癌・大腸癌と比較して極めて少ないことに起因すると考えられる。健常者4例では癌関連分類はほぼ生じなかった。
CUP患者への臨床応用: CUP4患者のcfDNAメチル化解析では、CUP1はLUAD/LUSCとして分類 (臨床的推定起源: 肺癌と一致)、CUP2はPRAD (前立腺癌) として分類 (推定起源: 前立腺癌と一致)、CUP3はBLCA (膀胱癌) として分類 (推定起源: 膀胱癌と一致) された (Fig. 6b)。CUP4のみ分類不能であった。これは、cfDNAメチル化解析によってCUP患者3/4例の組織起源を非侵襲的に推定できることを初めて実証した臨床的に重要な知見であり、臓器特異的分子標的治療の適用判断への応用が期待される。
考察/結論
CACOパネルの方法論的優位性: 本研究で開発されたCACOパネルは、2,572の選択された癌特異的高メチル化シトシンで27癌種に対してAUC>0.85以上を達成した点で、コスト効率に優れる。GrailのGalleriテスト (Liu et al. 2020; Klein et al. 2021) が100,000以上のCpG領域を標的とするのに対し、より小さなパネルでも同等以上のAUCが達成できることは、臨床応用における解析コストの削減と標準化に有利である。また、健常血液でのβ値<0.05というフィルタリング基準は、クローン性造血 (CHIP) や炎症による免疫細胞由来cfDNAの偽陽性シグナルを排除する設計となっており、液体生検の特異度向上に貢献する。このアプローチはこれまでの研究と異なり、より少ないマーカーで高い診断能を達成している点で新規性がある。
複数プラットフォーム互換性の臨床的意義: HM450K、EPIC、ビスルファイトシーケンシングの3プラットフォームで一貫した性能を示したことは、CACOパネルの臨床実装において多施設・複数検査機関での導入を支持する重要な特性である。これまで、異なるプラットフォームを使用する施設間でのメチル化データ互換性は臨床実装の障壁であったが、本研究はその問題を実証的に解決した。この知見は、CACOパネルが民族的・地理的背景の異なるコホートにも適用可能であることを示唆しており、国際的な臨床研究や診断への展開が期待される。
腫瘍内不均一性への頑健性の機構的考察: CACOパネルが腫瘍内不均一性 (ITH) に頑健である理由として、選択されたシトシンが癌化の初期イベントとして全腫瘍細胞に共通するプロモーター高メチル化 (腫瘍抑制遺伝子のサイレンシング等) を反映しているためと考えられる。これは、ソマティック変異が腫瘍クローンによって多様であるのと対照的であり、メチル化を組織起源分類の基盤として使用する根本的な利点を示す。この頑健性は、単一生検からの正確な診断を可能にし、診断の信頼性を高める。
cfDNA応用の課題と解決の方向性: 肺癌でのcfDNAからの組織起源推定の低い正解率 (1/4例) は、血漿中の腫瘍由来cfDNA分率の低さが主要因である。この問題は、cfMeDIP-seq (Shen et al. NatProtoc 2019) やlow-pass WGBSの深度最適化によって改善可能と考えられる。また、CACOパネルを標的としたビスペシフィックプローブによるハイブリダイゼーションキャプチャー法で2,572シトシンを選択的に深い深度でシーケンシングすることで、感度を大幅に向上させる可能性がある。
先行研究EPICUPとの比較: Moran et al. LancetOncol 2016によるEPICUPはFFPE組織のメチル化で原発不明癌を分類するパネルであり、本研究のCACOは血漿cfDNAへの応用まで拡張した点で新規性が高い。3/4例のCUP患者でcfDNA由来の組織起源推定が可能であったことは、組織生検が困難な転移性CUP患者への非侵襲的診断アプローチとして重要な臨床的意義を持つ。
残された課題: 今後の検討課題として、(1) cfDNA応用での感度向上 (特に肺癌での改善)、(2) 大規模前向き臨床コホートでの検証、(3) CUP診断ガイドラインへの組み込み、(4) 28癌種以外 (ESCA等) への拡張、(5) より微量なcfDNAでの感度向上 (早期癌スクリーニング応用)、(6) ビスルファイトシーケンシングパネルの費用最適化が挙げられる。また、CHOL、HNSC、LUADの各特異的パネルが閾値設定に困難が生じやすいことへの対策として、アッセイ感度と特異度のバランスを臨床的文脈に応じて調整する閾値最適化が必要である。
結論: CACOパネルは、2,572の癌特異的高メチル化シトシンで27癌種を網羅する汎癌種DNAメチル化分類パネルである。本研究で初めて、独立検証コホートで最高AUC 1.000・最低AUC 0.854を達成し、HM450K、EPIC、ビスルファイトシーケンシングの複数プラットフォームでの互換性を実証した。さらに、腫瘍内不均一性に頑健であり、cfDNAへの応用でBRCA・CUP患者の組織起源推定が可能であることを示した。本研究は、メチル化ベースの汎癌種診断・組織起源同定パネルの臨床実装に向けた重要な基盤を提供する。
方法
データソース: TCGAデータベースから28癌種7,950患者および707正常対照のDNAメチル化データ (HumanMethylation450K; HM450Kアレイ) を取得した。また、Gene Expression Omnibus (GEO) から95例の健常全血 (GSE41169) データを追加した。これらのデータは、発見コホートと検証コホートに4:1の比率でランダムに分割された。
CACOパネル構築: ディスカバリーコホート (全データの80%) でのワークフローは以下の通りである (Fig. 1a, Supplementary Fig. S1)。 (1) Steelテストを用いて、各癌種に特異的に高メチル化されたシトシンを系統的にスクリーニングした。非パラメトリックなSteelテストは、対照群に対する全グループの中央値を比較する手法であり、3回の異なるシードでの実行とFDR (Benjamini-Hochberg法) 補正により、q値<0.05の66,766シトシンを同定した。 (2) 他の27癌種、対応する正常組織、および健常血液との比較により、特異的高メチル化を確認した。WilcoxonテストとFDR補正により、q値<0.05の29,156シトシンを選択した。 (3) 健常血液でのβ値<0.05を条件に追加フィルタリングを行った。これは、液体生検への応用を考慮し、健常血液由来の偽陽性シグナルを排除するためである。最終的に、食道癌 (ESCA) を除く27癌種に対応する2,572の癌特異的高メチル化シトシンをCACOパネルとして選択した (Supplementary Table S1, S2)。各癌種のメチル化スコアは、選択されたシトシンの平均β値で算出した。このスコアをベータ分布にフィットさせ、偽陽性率と偽陰性率の合計が最小となる閾値を設定した (Supplementary Fig. S7, Supplementary Table S3)。
独立検証: 残り20%のデータを検証コホートとし、発見コホートとは完全に独立してCACOパネルの性能評価を行った。ROC曲線解析と感度・特異度を算出した。
複数プラットフォーム検証: 日本人患者コホート (九州大学別府病院ほか) から乳癌 (BRCA)、大腸直腸癌 (COADREAD)、胃癌 (STAD) の切除検体 (n=16 patients/癌種) をHumanMethylationEPIC (EPIC) アレイで解析し、HM450Kアレイで構築されたCACOパネルとのプラットフォーム間互換性を確認した。さらに、自ら開発したtPBAT-WGBS (TACS ligation-mediated Post-Bisulfite Adaptor Tagging - Whole Genome Bisulfite Sequencing) を用いて、COADREAD9例の原発・転移サンプルを解析し、ビスルファイトシーケンシングデータへの適用性を評価した。tPBATは、微量DNAからの全ゲノムビスルファイトシーケンシングを可能にするプロトコルである。
腫瘍内不均一性への頑健性: COADREAD 8患者からの多領域サンプル (原発66、肝転移4、隣接正常8) のメチル化データ (GSE90709) を用いて、CACOパネルが腫瘍内不均一性 (ITH) の影響を受けずに正確な診断が可能であるかを評価した。非教師あり階層的クラスタリングを用いた。
cfDNA解析: BRCA 3例、COADREAD 4例、肺癌 (LUAD/LUSC) 4例の患者血漿cfDNAと健常者4例のcfDNAメチル化データ (GSE122126) を取得し、CACOパネルを適用して組織起源推定性能を評価した。CUP患者4例の血漿cfDNAについても分析し、非侵襲的な組織起源同定の可能性を検討した。
統計解析: 癌特異的高メチル化シトシンの同定にはSteelテストとWilcoxonテストを用いた。P値はFDR補正を行い、q値<0.05を統計的に有意な差とした。2群間の相関はPearsonの積率相関係数で評価した。ROC曲線解析にはRのEpiパッケージを、t-SNE解析にはRtsneパッケージを用いた。