• 著者: The Cancer Genome Atlas Network
  • Corresponding author: Charles M. Perou (Lineberger Comprehensive Cancer Center, University of North Carolina at Chapel Hill, Chapel Hill, NC)
  • 雑誌: Nature
  • 発行年: 2012
  • Epub日: 2012-09-23
  • Article種別: Original Article
  • PMID: 23000897

背景

乳癌は世界中で年間 130 万例以上の新規症例と 45 万例以上の死亡を伴う、極めて不均一な疾患である。臨床的には、ER (estrogen receptor) 陽性群、HER2 (ERBB2) 増幅群、およびER、PR (progesterone receptor)、HER2の発現を欠く TNBC (triple-negative breast cancer) 群の3つに大別され、それぞれ異なる治療戦略がとられてきた。これまで、mRNA発現プロファイリングを用いた内在性サブタイプ、すなわち Luminal A、Luminal B、HER2E (HER2-enriched)、Basal-likeの分類が確立され、臨床予後との相関が示されてきた。しかし、これまでのゲノム研究の多くは、mRNA発現やDNAコピー数解析など、1つまたは2つの高情報量プラットフォームに限定されており、複数のオミクスデータを統合した包括的な分子像は「未解明」であった。特に、各サブタイプにおけるドライバー変異、エピジェネティックな変化、マイクロRNA (miRNA) およびタンパク質発現の異常がどのように相互作用し、腫瘍生物学を駆動しているかについての統合的な理解は「不足」していた。がんゲノムアトラス (TCGA; The Cancer Genome Atlas) プロジェクトでは、膠芽腫 TCGA et al. Nature 2008 や肺腺癌 Ding et al. Nature 2008、高悪性度漿液性卵巣癌 Network et al. Nature 2011 などの他のがん種において包括的なゲノム解析が進められてきたが、乳癌における多プラットフォームの統合解析は依然として「未確立」であり、個別化医療の進展に向けた大きな「knowledge gap」となっていた。本研究は、この知識の「不足」を解消するため、多次元の分子プロファイルを統合し、乳癌の包括的な分子ポートレートを提示することを目指した。

目的

本研究の目的は、825例の浸潤性乳癌について、WES (whole-exome sequencing)、SNP6.0コピー数解析、DNAメチル化アレイ、mRNAマイクロアレイ、miRNAシーケンシング、および RPPA (reverse-phase protein array) の6つの分子プラットフォームを用いて統合的な解析を行うことである。この多次元解析を通じて、乳癌の各内在性サブタイプに特異的な体細胞変異、ゲノムコピー数異常、エピジェネティックな変化、およびタンパク質発現プロファイルを詳細に同定し、腫瘍生物学を駆動する分子メカニズムを解明することを目指した。特に、PI3K、TP53、およびRB1経路の異常を詳細に評価し、新規のドライバー遺伝子を特定するとともに、乳癌のサブタイプと他のがん種、特に高悪性度漿液性卵巣癌との分子的な類似性を比較解析し、共通の治療標的や治療戦略の可能性を提示することを目的とした。

結果

症例構成と内在性サブタイプの多次元プロファイル: 評価対象となった466例の腫瘍において、PAM50分類による内在性サブタイプの分布は、Luminal Aが225例 (48%)、Luminal Bが126例 (27%)、HER2Eが57例 (12%)、Basal-likeが93例 (20%)、Normal-likeが8例であった (Fig. 1)。臨床的な IHC (immunohistochemistry) 分類(ER/PR/HER2)とPAM50サブタイプは高い相関を示したが、完全には一致しなかった。例えば、臨床的にHER2陽性と判定された症例のうち、約50%のみがHER2Eサブタイプに分類され、残りの多くはLuminalサブタイプに属していた。C-of-Cアプローチを用いた5つのプラットフォームの統合解析により、Basal-likeサブタイプが最も均一かつ明確なマルチプラットフォームシグネチャを示すことが明らかになった (Fig. 2)。なお、GATA3 (GATA binding protein 3) mRNA発現レベルは、Basal-likeサブタイプと比較してLuminal Aサブタイプで 4.5-fold 高値を示した。

有意変異遺伝子の同定と新規ドライバーの発見: 507名の患者から得られた510個 of 腫瘍サンプルのWES解析により、合計30,626個の体細胞変異が同定された。MuSiC解析により、FDR < 5%で35個の有意変異遺伝子が同定された (Table 1)。これには、既知の乳癌ドライバーである PIK3CA (全体の36%で変異)、TP53 (全体の37%で変異)、GATA3、CDH1、MAP3K1、PTEN、AKT1、RB1 などが含まれる。さらに、本研究により、乳腺発生に関与する TBX3 (n=13 tumors)、スプライシング因子である SF3B1 (n=15 tumors)、転写因子である RUNX1 (n=19 tumors) およびそのパートナーである CBFB (n=9 tumors) など、乳癌における新規の有意変異遺伝子が同定された。特に、SF3B1では再発性の K700E アミノ酸置換が4例で検出され、スプライシング異常が乳癌の病態に関与していることが示唆された。

サブタイプ特異的な体細胞変異とシグナル経路の異常: 体細胞変異の頻度とスペクトルは、内在性サブタイプ間で著しく異なっていた (Fig. 1)。Luminal Aサブタイプでは、PIK3CA 変異が45%と最も高頻度であり、次いで MAP3K1 (14%)、GATA3 (14%)、TP53 (12%)、CDH1 (9%) の順であった。MAP3K1 と MAP2K4 の不活性化変異は、Luminal A腫瘍の12%で相互排他的に認められ、p38-JNK1ストレスキナーゼ経路の不活性化がこのサブタイプの特徴であることが示された。これに対し、Basal-likeサブタイプでは TP53 変異が80%と極めて高頻度であり、その多くがナンセンス変異やフレームシフト変異による機能喪失型であったのに対し、PIK3CA 変異は9%と低頻度であった。HER2Eサブタイプでは、TP53 変異が72%、PIK3CA 変異が39%で認められ、HER2増幅 (80%) と共存していた。

PI3K経路活性化におけるゲノム異常とタンパク質発現の乖離: RPPAデータを用いたプロテオミクス解析により、PI3K-AKT-mTOR経路の活性化状態を評価した (Fig. 3)。興味深いことに、PIK3CA 変異を有する Luminal A 腫瘍では、pAKT (S473およびT308)、pS6、p4EBP1 などのPI3K経路活性化マーカーのタンパク質発現は上昇していなかった。対照的に、これらの経路活性化マーカーは、PIK3CA 変異が稀である Basal-like サブタイプにおいて最も高発現しており、これは PTEN および INPP4B (inositol polyphosphate 4-phosphatase type II) のゲノム欠失やタンパク質発現低下と強く相関していた (Fig. 3a)。この結果は、PIK3CA 変異の存在が必ずしも下流シグナルの単純な活性化を意味しないという、ゲノム異常とプロテオミクスプロファイルとの間の見かけ上の乖離を浮き彫りにした。なお、DNAメチル化グループ3(Luminal Bに富む)では、Wnt経路遺伝子の発現が log2FC -1.8 と著しく低下していた。

Basal-like乳癌と高悪性度漿液性卵巣癌の顕著なゲノム類似性: クロス腫瘍比較解析により、Basal-like乳癌は他の乳癌サブタイプ(LuminalやHER2E)よりも、高悪性度漿液性卵巣癌 Network et al. Nature 2011 と極めて類似したゲノムおよび分子プロファイルを示すことが明らかになった (Fig. 5)。両者は、TP53 変異の極めて高い頻度 (Basal-likeで80%、卵巣癌で96%)、BRCA1/BRCA2 の不活性化(生殖細胞系列/体細胞変異またはエピジェネティックなサイレンシング)、RB1 の LOH (loss of heterozygosity) や欠失、MYC (8q24) の増幅、および著しいゲノム不安定性を共有していた (Fig. 5a)。さらに、外部データセットを用いた相関解析により、Basal-like乳癌の遺伝子発現プロファイルは、漿液性卵巣癌や肺扁平上皮癌と高い相関を示すことが実証された (Fig. 5b)。

考察/結論

先行研究との違い: 本研究は、単一または少数のゲノムプラットフォームのみに依存していた「これまでと」異なり、6つの異なる分子プラットフォーム(WES、コピー数、メチル化、mRNA、miRNA、RPPA)を統合して乳癌の包括的な分子ポートレートを提示した点で極めて「対照的」である。これにより、単一のオミクス解析では見落とされていた、ゲノム異常とプロテオミクス活性化の乖離(例えば、PIK3CA変異とPI3K経路活性の不一致)を浮き彫りにした。

新規性: 本研究は、乳癌において TBX3、SF3B1、RUNX1、CBFB などの「新規」な有意変異遺伝子を「本研究で初めて」同定した。特に、SF3B1 の K700E 変異などのスプライシング因子の体細胞変異や、Basal-like乳癌と高悪性度漿液性卵巣癌 Network et al. Nature 2011 との間の顕著なゲノム類似性は、「これまで報告されていない」画期的な発見であり、乳癌のサブタイプ分類を単なる乳腺組織の枠組みを超えて、他のがん種と共通の分子病態(TP53/RB1/BRCA不活性化駆動型)として再定義した。

臨床応用: 本研究の知見は、乳癌の層別化治療における「臨床応用」に直結する極めて重要な「臨床的意義」を持つ。Luminal A群における高頻度な PIK3CA 変異 (45%) の同定は、PI3K経路阻害剤(アルペリシブなど)の患者選択バイオマーカーとしての開発を強力に後押しした。また、Basal-like乳癌における BRCA1/BRCA2 異常の集積(約20%)は、PARP阻害剤やプラチナ製剤の「臨床現場」での導入を支持する強力な理論的根拠となった。さらに、HER2Eサブタイプにおける EGFR/HER2 共発現プロファイルは、抗HER2療法の効果予測因子としての「臨床的有用性」が期待される。

残された課題: 本研究にはいくつかの「limitation」および「残された課題」が存在する。第一に、本論文発表時点での追跡期間中央値が17ヶ月と極めて短く、全生存期間 (OS) などの長期的な臨床アウトカムと分子サブタイプとの関連性の解析が不十分であった点は「今後の課題」である。第二に、臨床的なHER2陽性判定とHER2E mRNAサブタイプとの間の不一致(約50%の乖離)について、実臨床での最適な患者層別化に向けたさらなる検証が必要である。第三に、Basal-like乳癌の内部におけるさらなる不均一性(サブクラス)の解明や、PIK3CA変異と実際の治療感受性との乖離を説明する詳細なフィードバック機構の解明が「今後の研究」として求められる。

方法

本研究では、825例の乳癌患者から得られた腫瘍組織および対応する正常組織(生殖細胞系列)のDNA/RNAサンプルを収集した。このうち、466例の腫瘍(463名の患者)において、Agilent mRNA発現マイクロアレイ (n=547)、Illumina Infinium DNAメチル化アレイ (n=802)、Affymetrix 6.0 SNPアレイ (n=773)、miRNAシーケンシング (n=697)、およびWESの5つのプラットフォームのデータが共通して利用可能であった。さらに、348例についてはRPPAデータ (n=403) も取得された。WESは507名の患者から得られた510個の腫瘍について実施され、背景変異率を考慮したMuSiCアルゴリズムを用いて、FDR (false discovery rate) 5%未満を基準として有意に変異している遺伝子を同定した。

mRNA発現データは、PAM50 (50-gene prediction analysis of microarray) の50遺伝子モデルを用いて、Luminal A、Luminal B、HER2E、Basal-like、およびNormal-likeのサブタイプに分類された。miRNAデータは、miRBase v16を参照し、コンセンサス NMF (non-negative matrix factorization) クラスタリングにより7つのサブタイプに分類された。DNAメチル化データは、HM27 (HumanMethylation27) およびHM450アレイの共通プローブ574個を用いて非教師ありクラスタリングを行い、5つのメチル化グループを定義した。コピー数異常は GISTIC (Genomic Identification of Significant Targets in Cancer) アルゴリズムを用いて局所的な増幅および欠失を同定した。RPPAでは、171個の癌関連タンパク質およびリン酸化タンパク質の発現を定量した。

各プラットフォームから得られたクラスターは、C-of-C (cluster of clusters) アプローチによるコンセンサスクラスタリングに供され、多次元的な統合サブタイプが定義された。さらに、相互排他的な遺伝子異常パターンを検出する MEMo (Mutual Exclusivity Modules in Cancer) 解析や、パスウェイ活性を推定する PARADIGM (Pathway Recognition Algorithm using Data Integration on Genomic Models) 解析が実施された。統計学的解析においては、変異やコピー数異常と臨床病理学的因子との関連性を評価するために Fisher’s exact 検定や Mann-Whitney U検定が用いられた。また、乳癌細胞株、例えば MCF-7 や MDA-MB-231 などの既存データとの比較や、他のがん種、例えば高悪性度漿液性卵巣癌のTCGAデータとの比較解析も行われた。