• 著者: Sebastian Moran, Anna Martínez-Cardús, Sergi Sayols, Eva Musulén, Carme Balañá, Anna Estival-Gonzalez, Cátia Moutinho, Holger Heyn, Angel Diaz-Lagares, Manuel Castro de Moura, Giulia M Stella, Paolo M Comoglio, Maria Ruiz-Miró, Xavier Matias-Guiu, Roberto Pazo-Cid, Antonio Antón, Rafael Lopez-Lopez, Gemma Soler, Federico Longo, Isabel Guerra, Sara Fernandez, Yassen Assenov, Christoph Plass, Rafael Morales, Joan Carles, David Bowtell, Linda Mileshkin, Daniela Sia, Richard Tothill, Josep Tabernero, Josep M Llovet, Manel Esteller
  • Corresponding author: Manel Esteller (Cancer Epigenetics and Biology Program (PEBC), Bellvitge Biomedical Research Institute (IDIBELL), L’Hospitalet, Barcelona, Catalonia, Spain)
  • 雑誌: Lancet Oncology
  • 発行年: 2016
  • Epub日: 2016-09-19
  • Article種別: Original Article
  • PMID: 27575023

背景

原発不明癌 (CUP: cancer of unknown primary) は、転移巣のみが明らかで、詳細な検査を行っても原発臓器が同定できない特殊な癌群であり、全悪性腫瘍の約3-9%を占める (Varadhachary and Raber 2014)。米国だけでも年間80,000人以上の患者がCUPと診断され、世界的に癌関連死の第4位を占める極めて予後不良な疾患である (Greco et al. 2011)。診断後の中央値全生存期間 (OS) はわずか9ヶ月程度と報告されており、これは従来の免疫組織化学 (IHC: immunohistochemistry) や組織形態学的手法では原発臓器の特定が困難であることに起因する (Greco et al. 2009)。これらの従来手法の特異度・感度は60-80%程度にとどまり、CUP患者の約55%では詳細な精査後も原発部位が特定されないという課題が残されている。現行の標準治療は、多くの場合、経験的な白金製剤ベースの化学療法であるが、奏効率が低く臨床的ベネフィットは限定的である。しかし、原発臓器が正確に特定され、部位特異的治療が適用可能となれば、生存期間の大幅な改善が期待できる。CUPにおける原発部位特定の失敗が予後の主要な規定因子の一つであり、より高精度な分類手法の開発が強く求められてきた。DNAメチル化パターンは細胞の分化・発生起源と密接に関連しており、腫瘍細胞が転移を形成しても原発癌種に特異的なメチル化パターンを保持する生物学的特性がある。この特性は、エピゲノム情報が組織起源の「記憶」として機能することを示唆している。これまでの研究では、遺伝子発現マイクロアレイに基づく分類器が約75%の精度で原発部位を予測しているが、RNAの不安定性やFFPE (formalin-fixed paraffin-embedded: ホルマリン固定パラフィン包埋) 検体での適用、コストなどの限界が指摘されており、臨床現場で実用可能な高精度診断ツールの開発が不足していた。特に、転移巣サンプルのエピゲノム情報が原発部位の特性をどの程度保持しているか、またそれに基づく治療が実際に患者の生存期間を改善するかという点については未解明な部分が多く、臨床的に実証されたエピゲノム分類器は存在しなかった。本研究は、このDNAメチル化プロファイリングを用いて、CUPの原発部位を診断する新規戦略を開発し、その臨床的有用性を検証することを目的とした。

目的

本研究の目的は、ゲノムワイドDNAメチル化プロファイリング (Illumina EPIC 850kアレイ) とランダムフォレストアルゴリズムを用いたCUP分類システム「EPICUP (Epigenetic Profiling for Cancer of Unknown Primary)」を大規模多施設コホートで開発・検証することである。具体的には、以下の2点を評価する。

  1. 38腫瘍型にわたるEPICUPの分類精度 (特異度、感度、陽性的中率 (PPV: positive predictive value)、陰性的中率 (NPV: negative predictive value)) を評価する。これには、既知の原発癌サンプルおよび転移巣サンプルを用いた検証が含まれる。特に、従来のIHCベースの診断と比較して、DNAメチル化プロファイリングがどの程度診断精度を向上させるかを定量的に示すことを目指す。
  2. EPICUPの予測に基づき部位特異的治療を受けたCUP患者群が、経験的治療を受けた患者群と比較して、全生存期間 (OS) を改善するかどうかを評価する。これにより、EPICUPが単なる診断ツールに留まらず、患者の臨床アウトカムに直接的な影響を与えるかを検証する。

これらの目的を達成することで、CUP患者の診断と治療選択におけるアンメットニーズに対応し、より精密な医療の実現に貢献することを目指す。

結果

EPICUPの分類精度と既存IHC手法を大幅に超える高精度: トレーニングコホートで構築したランダムフォレストモデルを検証コホートで評価した。検証コホートには、独立した既知腫瘍サンプルが用いられ、アレイの再現性検証として n=3 replicates の技術的複製を異なるバッチで測定し、100%の一致率を得た。EPICUPの分類性能は、特異度 99.6% (95% CI 99.5-99.7%)、感度 97.7% (95% CI 96.1-99.2%)、陽性的中率 (PPV) 88.6% (95% CI 85.8-91.3%)、陰性的中率 (NPV) 99.9% (95% CI 99.9-100.0%) を達成した (Table 1)。この高い精度は、従来のIHCベース分類の精度を大幅に上回るものである。転移巣サンプルである n=534 metastases においても、94% (501/534例) が正確に原発部位に分類され、転移によっても腫瘍細胞のメチル化パターンが原発部位の特性を保持することが確認された。また、FFPE固定パラフィン包埋検体でも高い分類精度を示し、実臨床での日常的な生検検体への適用可能性が実証された。

CUPコホートでの分類結果と部位特異的治療による生存期間改善: 実際のCUP患者 n=216 patients を対象にEPICUPによる原発臓器予測を実施した結果、87% (188/216例) が原発臓器に分類された。最も多く予測された腫瘍型は非小細胞肺癌 (NSCLC) で21% (39/188例) であり、次いで頭頸部扁平上皮癌 (10%, 18/188例)、乳癌 (9%, 17/188例)、結腸癌 (9%, 16/188例) であった。EPICUP誘導の部位特異的治療を受けたCUP患者である n=31 patients は、経験的治療を受けた患者である n=61 patients と比較してOSが有意に延長した。主要エンドポイントである全生存期間において、部位特異的治療群は経験的治療群と比較して、ハザード比 (HR) 3.24 (95% CI 1.42-7.38, p=0.0051) と有意な生存改善を示した (Figure A)。中央値OSは部位特異的治療群で13.6ヶ月 (95% CI 4.1-55.4) であったのに対し、経験的治療群では6.0ヶ月 (95% CI 0.3-57.4) であり、約2.3倍の延長(2.3-fold increase)が認められた。観察期間中の死亡割合は、部位特異的治療群で23% (7/31例) vs 経験的治療群で51% (31/61例) と大幅に低下した (Fisher’s exact test, p=0.013)。多変量Cox回帰モデルでは、部位特異的治療がOS of CUPの独立した予後因子であることが示された (Figure B)。

特定のサブグループにおける遺伝子変異スクリーニングと個別化医療: EPICUPによりNSCLCと予測されたサブグループ (n=16例) において、EGFR変異陽性例に対する部位特異的治療の効果を評価した。このサブグループにおいて、EGFR変異が検出された1例はエルロチニブ治療を受け、診断から55.4ヶ月時点で生存中であり、CUP患者の通常の予後を考慮すると予想外の長期生存例であった。このEGFR変異陽性例における部位特異的治療のハザード比 (HR) は 3.24 (95% CI 1.42-7.38, p=0.0051) と、主要エンドポイントと同様に極めて良好な治療効果を示した。また、EPICUPにより乳癌と予測された患者12例中1例でHER2遺伝子増幅が確認され、HER2阻害薬による治療の可能性が示唆された。これらの結果は、EPICUPによる原発部位の特定が、ゲノムドリブン薬剤選択を通じて実際の生命予後を改善することを実証した。アルゴリズム開発段階では、各CpGサイトのメチル化レベルの差(fold change 1.5以上、p < 0.01)を基準として特徴量を選択しており、このエピゲノム特徴量の厳選が、高精度な個別化医療の基盤となっている。

EPICUP予測の臨床的妥当性検証: EPICUPの予測精度は、複数の方法で検証された (Table 3)。第一に、剖検による確認として、1例のCUP患者においてEPICUPは肉腫と予測し、剖検により髄膜と上腕骨に肉腫の転移が確認され、IHCでビメンチン陽性となり診断が再確認された。第二に、後発原発巣の検出として、38例のCUP患者において、EPICUP予測後に臨床的に原発巣が検出された。このうち33例 (87%) でEPICUPの予測と一致した。例えば、膵癌と予測されたCUP患者は、28ヶ月後にCT画像で膵頭部の肥厚が確認され、生検により膵癌と診断された。第三に、光顕およびIHCとの比較として、181例のCUP患者において、EPICUPは光顕による病理診断と174例 (96%) で一致した。また、包括的なIHCアルゴリズムが適用された31例のCUP患者では、EPICUPの結果は全ての症例でIHCによる原発部位予測と一致した。これには、NSCLC (TTF-1) や乳癌 (マンモグロビン) などの部位特異的マーカーが含まれる。

考察/結論

先行研究との違い: 本研究は、従来のIHCや遺伝子発現プロファイリングを用いたCUP診断手法と異なり、DNAメチル化という極めて安定したエピゲノムマーカーを用いることで、FFPE検体でも高精度かつ再現性の高い診断を可能にした。IHCは特異度・感度が限定的であり、遺伝子発現プロファイリングはRNAの不安定性やFFPE検体での適用に課題があったが、本研究のEPICUPシステムはこれらの限界を克服している。また、ランダムフォレストアルゴリズムが38腫瘍型の多クラス分類を単一モデルで実現した点は、異なる腫瘍型ごとに専用分類器を必要とする先行研究 (Hainsworth et al. 2013) と比較して対照的であり、技術的な優位性を持つ。

新規性: 本研究で初めて、DNAメチル化プロファイリングに基づくCUP分類システムが、CUP患者のOSを統計学的に有意に改善することを新規に示した。これは、単なる原発部位の同定にとどまらず、その後の部位特異的治療選択が患者の生命予後に直接的な影響を与えることを実証した点で、これまで報告されていない極めて高い新規性を持つ。特に、EGFR変異陽性NSCLCと予測された患者がエルロチニブ治療により長期生存した症例は、精密医療の観点から本システムの有用性を強く示唆する。

臨床応用: 本知見は、CUP患者の診断と治療戦略における臨床応用に直結する。臨床的意義として、EPICUPは従来の診断ワークアップで原発部位が特定できない患者に対して、客観的かつ高精度な情報を提供し、部位特異的治療への道を開く。これにより、患者はより効果的で毒性の低い治療を受けることが可能となる。また、EPICUPによる原発部位の予測は、EGFR変異やHER2増幅などの薬剤標的となる遺伝子異常のスクリーニングを効率化し、臨床現場における個別化医療の推進に貢献する。診断から5日という迅速な結果提供も、実臨床での有用性を高める要因となる。

残された課題: 今後の課題として、EPICUP誘導治療の前向き介入試験 (ランダム化比較試験) でのOS改善の確認が不可欠である。また、低腫瘍純度検体での感度維持のための前処理最適化や、血漿中のメチル化プロファイリング (cfDNA: cell-free DNA) への応用における技術的課題の解決が挙げられる。本研究のlimitationとして、後ろ向き解析を中心としたコホート設計であることが挙げられるが、EPICUPのコンセプトはcfDNA解析への拡張が原理的に可能であり、非侵襲的な液体生検によるCUP診断という次のフロンティアに向けた技術的基盤を提供している。

方法

EPICUPは、Illumina EPIC 850kメチル化アレイデータを用いたランダムフォレストアルゴリズムを基盤とする多クラス分類器であり、38種類の腫瘍型を識別するように設計された。

患者およびサンプル: トレーニングコホートには、既知の原発癌2790例 (38腫瘍型、85例の転移巣を含む) を使用した。これらのサンプルは、PEBC (Cancer Epigenetics and Biology Program: 癌エピジェネティクス・生物学プログラム) コホート (n=692) と、TCGA (The Cancer Genome Atlas) の公開データ (n=2098) から収集された。検証コホートには、独立した7691例の既知腫瘍サンプル (PEBCコホートn=1948、TCGAデータn=5743) を用い、534例の転移巣サンプルが含まれた。CUP患者は、欧州臨床腫瘍学会 (ESMO) のガイドラインに従い、標準的な診断ワークアップで原発部位が特定できなかった転移性腫瘍と定義された。実際のCUP患者216例のパラフィン包埋腫瘍組織サンプルは、米国、スペイン、ドイツ、イタリア、オーストラリアの11の医療センターから後ろ向きおよび前向きに収集された。また、アレイの検出感度と特異度のバリデーションコントロールとして、既知のがん細胞株である A549 (非小細胞肺癌細胞株) や MCF-7 (乳癌細胞株) から抽出したDNAを対照群として用いた。

DNA抽出とメチル化マイクロアレイ解析: 新鮮凍結サンプルからのDNAはDNeasy (Qiagen社のDNA抽出キットであるDNeasy Blood & Tissue Kit) を用いて抽出され、FFPEブロックからはEZNA FFPE DNA kit (Omega Bio-tek) を用いてDNAが抽出された。DNAメチル化マイクロアレイ研究のため、FFPE DNA 300 ngまたは新鮮凍結DNA 600 ngをEZ-96 DNA Methylation kit (Zymo Research Corp) で処理し、バイサルファイト変換を行った。FFPEサンプルからのバイサルファイト変換DNAは、Infinium FFPE Restoration guide (Illumina) に従って処理された。

データ解析とアルゴリズム開発: 生データは、R統計環境内のbioconductorパッケージ「lumi」を用いて、カラーバイアス調整、バックグラウンドレベル調整、クォンタイル正規化の3ステップで正規化された。各CpGサイト (485,577箇所) のメチル化レベル (β値) は、メチル化シグナルと非メチル化シグナルの合計に対するメチル化シグナルの比率として計算された。XおよびY染色体に関連するプローブ、ならびにSNP (single nucleotide polymorphism: 一塩基多型) を含むプローブは除去された。 正規化後、トレーニングセットの各サンプルを38腫瘍型のいずれかに分類し、各CpGサイトについて一元配置分散分析 (one-way ANOVA) を実施した。Bonferroni法でp値を補正し、Tukeyの正直有意差事後検定を適用した。少なくとも1つの腫瘍型に特異的なCpG (Δβ > 0.2, p < 0.01) が選択された。ランダムフォレスト機械学習法 (n-tree=1000) を用いて、各CpGサイトの変数重要度を評価した。最も重要な変数から順にランク付けされた変数を用いてネストされたモデルを構築し、モデルの予測能力が停滞するまで続けた。最終的に、予測値を追加しない冗長なCpGは除外された。これにより、最適なCpGセットを用いたランダムフォレスト分類アルゴリズムが作成された。

統計解析: CUP患者の疾患アウトカムと化学療法の種類との関連を生存解析で検討した。カテゴリカル変数の関連はχ²検定またはFisher’s exact testで解析された。Kaplan-Meier曲線とlog-rank testを用いて、部位特異的治療の無増悪生存期間 (PFS) およびOSへの影響を評価した。OS (診断から死亡までの期間) と臨床パラメータの関連は、単変量および多変量Cox regressionモデルで評価された。すべての統計検定は両側検定であり、p < 0.05が統計的に有意とされた。