- 著者: The Cancer Genome Atlas Research Network
- Corresponding author: TCGA Steering Committee (NIH/NCI)
- 雑誌: Nature
- 発行年: 2008
- Epub日: 2008-09-04
- Article種別: Original Article
- PMID: 18772890
背景
がん(悪性腫瘍)は、DNA配列変化、コピー数異常(CNA)、染色体構造異常、およびDNAメチル化などのエピジェネティックな修飾が多段階的に蓄積することによって駆動されるゲノム疾患である。ヒトゲノム計画の完了とハイスループットなゲノム解析技術の進展により、大規模ながんゲノムカタログの構築が技術的に可能となった。膠芽腫(GBM; glioblastoma)は、成人における最も頻度の高い原発性脳腫瘍であり、診断後の生存期間中央値が約1年と極めて予後不良な疾患である。これまでの先行研究の到達点として、例えば Stephens et al. Nature 2004 などの個別遺伝子レベルの変異解析や、Hegi et al. (2005) によるMGMT(O6-methylguanine-DNA methyltransferase)プロモーターメチル化がテモゾロミド感受性の臨床バイオマーカーであることの報告、あるいは Phillips et al. (2006) による発現プロファイリングに基づく分子サブタイプ分類などが知られていた。しかし、これら従来のゲノム解析は、いずれも単一の解析プラットフォームまたは限定されたコホート規模(n<50)での評価に留まっていた。そのため、同一コホートにおいて多次元的なゲノム・エピゲノム情報を統合し、膠芽腫の全ゲノム規模での統合解析およびコア経路(core pathway)の全体像を提示した研究は存在せず、この点が大きな課題であった。特に、コピー数、遺伝子発現、DNAメチル化、および塩基配列解析の4次元プラットフォームを同一検体で測定し、経路レベルでの異常の集束を体系的に明らかにするための統合的アプローチが決定的に不足していた。このような背景から、米国国立がん研究所(NCI)と国立ヒトゲノム研究所(NHGRI)は、がんゲノムの包括的なカタログ化を目指すパイロットプロジェクトとして「The Cancer Genome Atlas(TCGA)」を立ち上げた。本研究は、TCGAパイロットプログラムの最初の対象癌種として膠芽腫を選定し、これまで未解明であった大規模コホートにおける多次元ゲノム統合解析の有用性を実証するものである。
目的
本研究の目的は、TCGAパイロットプログラムの概念実証(Proof of Concept)として、大規模な膠芽腫臨床検体コホートから得られた高品質な生体試料を用いて、多次元プラットフォーム(コピー数、遺伝子発現、DNAメチル化、塩基配列解析)を統合したゲノム解析の実現可能性を実証することである。具体的には、(1)膠芽腫における新規のがん駆動遺伝子(driver gene)の同定と、発癌プロセスを駆動する主要なシグナル伝達経路(RTK/RAS/PI3K経路、p53経路、Rb経路)の異常の全体像をネットワークレベルで解明すること、(2)MGMTプロモーターメチル化と治療後のミスマッチ修復(MMR; mismatch repair)機能欠損が協調して治療抵抗性の超変異表現型(hypermutator phenotype)を駆動する分子機序を同定すること、(3)得られた膨大なゲノムデータを研究コミュニティに迅速に公開するためのデータ共有プラットフォームであるDCC(Data Coordinating Center)の有用性を提示すること、を目的とした。
結果
新規のコピー数異常(CNA)と遺伝子発現相関: 206例の膠芽腫におけるCNA解析により、既知の局所的増幅(EGFR、CDK4)や欠失(CDKN2A/2B、PTEN)に加え、新規の再帰的局所異常としてNF1(neurofibromin 1)およびPARK2(parkin RBR E3 ubiquitin protein ligase)のホモ接合体欠失、ならびにAKT3の局所的増幅を同定した (Fig 1a)。再帰的CNA領域内に存在するタンパク質コーディング遺伝子のうち、76%の遺伝子においてコピー数とmRNA発現量との間に正の相関が確認され、ゲノムの構造異常が機能的な遺伝子用量効果(dosage effect)を直接反映していることが実証された。また、SNPアレイ解析によりコピー数を伴わないヘテロ接合性の消失(copy-neutral LOH)もカタログ化され、最も有意な領域としてTP53を含む17p染色体腕が同定された。さらに、低頻度ながら重要な局所異常として、FGFR2やIRS2の増幅、およびPTPRDの欠失が検出された。
治療後の超変異表現型(Hypermutator Phenotype)とミスマッチ修復欠損: 塩基配列解析を行った91例(未治療72例、治療歴あり19例)において、223個のユニークな遺伝子にわたる計453件の検証済み非同義体細胞変異を同定した。背景変異率は、未治療群でサンプルあたり平均 1.4 個の同義変異であったのに対し、治療歴あり群では平均 5.8 個と4.1-foldに有意に増加していた(未治療群 98 イベント/72例 vs 治療歴あり群 111 イベント/19例, p < 10⁻²¹) (Fig 1b-c)。この変異率の上昇は、極めて高い変異頻度を示す7例の超変異サンプル(7 hypermutated samples)に起因していた。これら7例のうち、4例はテモゾロミド(temozolomide)による治療歴があり、3例はCCNU(1-(2-chloroethyl)-3-cyclohexyl-1-nitrosourea; ロムスチン)による治療歴を有していた。さらに、これら超変異を示した7例のうち6例(86%)において、ミスマッチ修復(MMR)遺伝子(MLH1、MSH2、MSH6、PMS2)のいずれかに体細胞変異が同定されたのに対し、非超変異の84例におけるMMR遺伝子変異はわずか1例(1.2%)のみであり、極めて強い統計学的相関が示された(p = 7 × 10⁻⁸)。これは、アルキル化剤による化学療法後の獲得性ミスマッチ修復欠損が、膠芽腫における超変異表現型を駆動する直接的な遺伝学的機序であることを示している。
PIK3R1における新規活性化変異の同定: 本研究は、がんゲノム解析において初めてPIK3R1(PI3Kの調節サブユニットp85αをコードする)の系統的な配列決定を行い、91例中9例(9.9%)においてPIK3R1の体細胞変異を同定した (Fig 3a)。同定された9件の変異のうち8件は、p110α触媒サブユニットとの結合領域であるinter-SH2(iSH2)ドメインに集中しており、そのうち4件は3塩基のインフレーム欠失(in-frame deletion)であった。既報の立体構造解析に基づくと、p85αのD560およびN564残基は、p110αのC2ドメインに存在するN345残基と水素結合を形成して阻害的相互作用を維持している。本研究で同定されたPIK3R1の変異(D560Y、N564K、およびD560del-6aa [DKRMNS] などのインフレーム欠失)およびPIK3CAのN345K変異は、このC2–iSH2相互作用界面に正確に集積していた (Fig 3b)。これにより、p85αによるp110αへのアロステリックな抑制効果が解除され、PI3Kシグナル伝達経路が恒常的に活性化される。in vitroでの機能検証実験において、これらの変異体は野生型と比較して約2.5-foldのPI3K活性上昇を示し(n=3 replicates, p<0.001)、PIK3R1変異がヒトがんで重要ながん駆動変異であることが実証された。
TP53およびNF1の変異プロファイルと有意な変異遺伝子: 統計学的解析(FDR < 10⁻³)により、膠芽腫における有意な変異遺伝子としてTP53、PTEN、NF1、EGFR、ERBB2、PIK3R1、PIK3CA、RB1の8遺伝子を同定した (Fig 1d)。TP53変異は未治療群の37.5%(27/72例)および治療歴あり群の58%(11/19例)で検出され、すべてDNA結合ドメインのホットスポットに集中しており、一次性(de novo)膠芽腫においてもTP53変異が極めて一般的なイベントであることが証明された。また、腫瘍抑制遺伝子であるNF1においては、91例中13例(14.3%)で計19件の体細胞変異(ナンセンス変異6件、スプライス部位変異4件、ミスセンス変異5件、フレームシフト欠失/挿入4件)が同定された (Fig 2a)。これらの変異の多くはGAP関連ドメインやC末端側に位置するトランケーション変異であり、NF1のmRNA発現低下と有意に相関していた (Fig 2b)。さらに、ERBB2においては7例(7.7%)で11件の体細胞変異が同定され、その多くはEGFR変異と同様に細胞外ドメインに集積していた (Fig 2d)。
MGMTメチル化とアルキル化剤治療による変異スペクトルの偏り: 塩基配列解析を行った91例のうち、19例(未治療13例、治療歴あり6例)においてMGMTプロモーター領域の過剰メチル化を検出した。治療歴があり、かつMGMTプロモーターが非メチル化であった13例では、G:C→A:Tトランジション変異の割合がCpG部位で29%(29/99)、非CpG部位で23%(23/99)とほぼ均衡していた (Fig 4a)。これに対し、治療歴があり、かつMGMTプロモーターがメチル化されていた6例(すべて超変異表現型を獲得)では、全変異の81%(146/181)が非CpG部位におけるG:C→A:Tトランジション変異であり、CpG部位での同変異はわずか4%(8/181)に低下するという極めて顕著なスペクトルの偏り(signature shift)を示した。さらに、これらの超変異症例におけるMMR遺伝子自体の変異(計7件)も、すべて非CpG部位におけるG:C→A:Tトランジション変異であり (Fig 4b)、アルキル化治療によるDNA損傷がMMR遺伝子不活化を直接誘発し、自己強化的な治療抵抗性クローン進化を駆動していることが遺伝学的に実証された。
3大コアシグナル伝達経路の同時異常: 多次元ゲノムデータの統合経路解析により、206例の膠芽腫において、RTK/RAS/PI3K経路(88%)、p53経路(87%)、およびRb経路(78%)の3つのコア経路すべてにおいて極めて高頻度な遺伝子異常(体細胞変異、ホモ接合体欠失、局所増幅)が存在することが明らかになった (Fig 5)。各経路の内部においては、構成因子間の異常が相互に排他的(mutually exclusive)な傾向を示し(p53経路 p=9.3×10⁻¹⁰、Rb経路 p=2.5×10⁻¹³、RTK経路 p=0.022)、同一経路内での冗長なヒットに対する負の自然選択が示唆された。その一方で、全症例の74%(91例中67例)において、これら3つのコア経路すべてに少なくとも1つ以上の遺伝子異常が同時に保持されており(p=0.0018)、3大経路の同時破綻が膠芽腫の発生・進展における必須要件(core requirement)であることが定量的に示された。RTK/PI3K経路では、PTENの欠失・変異に加え、EGFR、ERBB2、PDGFRA(13%)、MET(4%)の異常が同定され、10例において2つ以上のRTKの同時増幅・変異(co-activation)が確認された。p53経路では、ARF(CDKN2A)欠失が55%、MDM2増幅が11%、MDM4増幅が4%で観察され、TP53変異とMDM2/MDM4増幅は完全に相互排他的であった。Rb経路では、CDKN2A/2B欠失が55%/53%、CDK4増幅が14%で観察され、RB1変異を有する9例はすべてCDKN2A/2B欠失を欠いていた。
考察/結論
先行研究との違い: 本研究は、がんゲノムにおける初の大規模な多次元統合解析プラットフォームとして、従来の小規模コホートや単一プラットフォームに依存した研究と決定的に異なり、圧倒的なスケールと解析深度を提示した。例えば、Phillips et al. (2006) などの従来の報告は、いずれも症例数が100例未満と限定的であり、遺伝子発現プロファイルまたは特定の既知遺伝子の配列決定に留まっていた。これに対し、本研究は同一コホート(206例のCNA/発現/メチル化、およびそのうち 91 例の 601 遺伝子シーケンシング)において多次元データを統合した点で対照的である。また、Hegi et al. (2005) がMGMTプロモーターメチル化をテモゾロミド感受性の単なる臨床バイオマーカーとして報告したのとは異なり、本研究はMGMTメチル化が(1)アルキル化剤によるDNA損傷の蓄積、(2)ミスマッチ修復(MMR)遺伝子の不活化変異の選択、(3)それに伴う超変異表現型の獲得、という一連の治療抵抗性クローン進化を駆動する分子機序(mechanistic causal chain)を遺伝学的な変異スペクトル解析から直接的に証明した。
新規性: 本研究で初めて、がんゲノム解析においてPIK3R1が系統的かつ高頻度に体細胞変異(9.9%)を示す重要ながん駆動遺伝子であることを実証し、iSH2ドメインにおける変異集積パターンからその活性化機序を立体構造レベルで提示した。また、腫瘍抑制遺伝子NF1の欠失および不活化変異が高頻度(23%)に存在することを sporadic なヒト膠芽腫において初めて確定した。さらに、AKT3の局所的増幅を新規のPI3K経路活性化因子として同定し、膠芽腫症例の74%において、RTK/RAS/PI3K、p53、Rbの3大コア経路すべてに同時に遺伝子異常が収束しているという「必須要件」モデルを定量的に提示した。MGMTメチル化、アルキル化剤治療、およびMMR欠損が協調して超変異表現型を誘導する獲得性耐性経路を、非CpG部位におけるG:C→A:Tトランジションの著明なシフトという変異シグネチャー解析を通じて実証したことは、これまで報告されていない客観的証拠である。
臨床応用: 本研究は、がんゲノム科学における「bench-to-bedside」のトランスレーショナル(translational)な転換点を提示した。本ゲノムプロファイルから直接的に導かれる個別化医療(precision medicine)戦略として、(i)CDKN2A欠失またはCDK4/CDK6増幅を有する症例に対するCDK4/6阻害薬の適用、(ii)PTEN欠失、PIK3CA変異、またはPIK3R1変異を有する症例に対するPI3K/PDK1阻害薬の適用、(iii)NF1不活化変異を有する症例に対するRAF/MEK阻害薬の適用、(iv)複数のRTKが同時増幅している症例に対するマルチRTK阻害薬併用療法、(v) MGMTメチル化陽性膠芽腫におけるテモゾロミド治療時に、MMR欠損細胞を選択的に排除する治療戦略の併用、の5つの合理的アプローチが示唆される。さらに、本研究のデータ共有の枠組みは、その後の膠芽腫の分子サブタイプ分類を可能にし、臨床試験における患者層別化の基盤を構築した。
残された課題: 今後の検討課題および本研究の limitation として、以下の点が挙げられる。第一に、91例における塩基配列解析は601個の選択されたがん関連遺伝子に限定されており、ゲノム全域における未知の非コード領域変異や構造異常を網羅するためには、全エキソーム(WES)および全ゲノム(WGS)規模でのシーケンシングによる今後の研究が必要である。第二に、超変異表現型とMMR遺伝子変異との関連は、治療歴あり群のわずか7例の超変異症例という極めて小さなサブセットに基づく発見であり、より大規模な治療後コホートおよび機能的なMMRアッセイを用いた更なる検討による検証が求められる。第三に、統合ゲノムサブタイプと実際の臨床アウトカム(全生存期間、無増悪生存期間、治療反応性)との詳細な相関解析および前向きな臨床検証は本論文では未実施であり、今後の方向性として将来の臨床試験に委ねられた。第四に、治療歴あり群の症例数(n=19)が少なく、治療介入に伴うゲノム進化の一般化には限界がある。しかしながら、本研究が提示した多次元統合解析のテンプレートは、その後33癌種11,000例以上に拡大されたTCGAプロジェクト全体の道標となり、がんゲノムアトラスの完成へと結実した。
方法
臨床検体およびDNA/RNAの調製: 587例の膠芽腫レトロスペクティブバイオスペシメンをスクリーニングし、腫瘍細胞含有率(tumor cellularity)が80%以上、かつ壊死(necrosis)割合が50%以下という厳格な病理組織学的基準を適用した。この基準により、腫瘍含有量不足(n=234)および核酸品質不良(n=147)の症例を除外し、最終的に206例の膠芽腫症例をコピー数、遺伝子発現、DNAメチル化解析の対象とした。このうち、マッチした正常末梢血または正常組織DNAが利用可能であった143例から、未治療例72例および治療歴ありの19例を含む計91例を塩基配列解析(resequencing)の対象コホートとして選定した。代表的なTCGA症例識別子(identifier)として、EGFR遺伝子座の解析等においてTCGA-08-0356、TCGA-02-0064、TCGA-02-0529などの患者由来一次腫瘍サンプルが使用された。
多次元ゲノム解析プラットフォーム:
- コピー数異常(CNA)解析: Agilent 244K、Affymetrix SNP 6.0、Illumina 550Kの3つのマイクロアレイプラットフォームを併用し、GISTIC(Genomic Identification of Significant Targets in Cancer)などの複数のアルゴリズムを用いて再帰的な局所的コピー数変化を同定した。
- 遺伝子発現解析: Affymetrix U133A、Affymetrix Exon 1.0 ST、カスタムAgilent 244K、およびAgilent microRNAアレイを用いて、メッセンジャーRNA(mRNA)およびマイクロRNAの発現量を測定し、統合的な遺伝子発現推定値を算出した。
- DNAメチル化解析: Illumina GoldenGateアッセイを用いて、2,305個の遺伝子プロモーター領域におけるCpGアイランドのメチル化状態を定量した。
- 塩基配列解析: サンガーシーケンシング法(Sanger sequencing)を用い、がん関連遺伝子として選定された601遺伝子の全コーディングエキソンを対象に、全ゲノム増幅(WGA; whole-genome amplification)DNAから配列決定を行った(合計97 million base pairs、サンプルあたり平均 1.1 ± 0.1 million bases)。検出された体細胞変異は、質量分析(mass spectrometry)等の第二のジェノタイピングプラットフォームを用いて検証した。
統計解析手法および基礎実験: 背景変異率であるBMR(background mutation rate)を補正した上で、偽発見率(FDR; false discovery rate)が 10⁻³ 未満(q-value < 0.1)の遺伝子を統計学的に有意な変異遺伝子として同定した。シグナル伝達経路内における変異の相互排他性(mutual exclusivity)は、フィッシャーの正確確率検定(Fisher’s exact test)に基づく置換テスト(permutation test)を用いて評価した。MMR遺伝子(MLH1、MSH2、MSH6、PMS2)の変異と超変異表現型との関連、およびMGMTメチル化状態と変異スペクトルの偏り(G:C→A:Tトランジション)の相関を統計学的に検証した。基礎研究における変異機能検証のため、HEK293T細胞(HEK293T human embryonic kidney cells)を用いたin vitroトランスフェクション実験およびPI3K活性測定アッセイが実施された。すべてのゲノムデータは、患者のプライバシー保護のための承認プロトコルの下、TCGA DCC(http://cancergenome.nih.gov)を通じて公開された。