- 著者: Joshua D. Campbell, Anton Alexandrov, Jaegil Kim, et al. (TCGA Research Network)
- Corresponding author: Matthew Meyerson (Dana-Farber Cancer Institute); Ramaswamy Govindan (Washington University)
- 雑誌: Nature Genetics
- 発行年: 2016
- Epub日: 2016-05-09
- Article種別: Original Article
- PMID: 27158780
背景
肺癌は世界的に最多の癌死原因であり、2015年に米国で推定221,000例の新規発症・158,000例の死亡が見込まれた Cancer et al. Nature 2014。非小細胞肺癌 (NSCLC) の主要2サブタイプである肺腺癌 (ADC) と肺扁平上皮癌 (SqCC) は、それぞれ固有の臨床的・病理学的特徴を持つ。例えば、喫煙は両サブタイプの主要なリスク因子であるが、肺ADCの約10〜15%は非喫煙者で発症する。EGFR、ALK、ROS1などの遺伝子に活性化ゲノム変異を有する肺ADC患者では、対応する受容体型チロシンキナーゼ (RTK) 阻害剤による分子標的治療が劇的な奏効を示すことが知られている。一方、これらの標的変異は喫煙関連の強いSqCCではほとんど認められず、治療戦略が大きく異なる。
これまでの肺ADCおよびSqCCの包括的ゲノム解析は、TCGAによる研究(ADC 230例、SqCC 178例)などが行われてきたが、その規模は限られていた TCGA et al. Nature 2012。このため、低頻度で存在する新規ドライバー遺伝子の統計的同定や、両サブタイプ間でのゲノム変化の包括的な比較解析は不十分であった。特に、タバコ発がん物質への長期曝露やAPOBECシチジンデアミナーゼの異常活性などの内在性変異プロセスによって蓄積する多数のパッセンジャー変異の中から、低頻度の重要なドライバー遺伝子を識別するためには、より大規模なコホートでの解析による統計的検出力の向上が求められていた Lawrence et al. Nature 2013。既存のデータセットでは、両サブタイプ間での体細胞ゲノム変化の包括的な比較研究が不足しており、特に低頻度のドライバー遺伝子の同定や、特定の変異シグネチャーの臨床的意義に関する知見が未解明であった。また、RTK-Ras-Raf経路の網羅的評価、ならびに免疫療法の潜在的有効性を示すネオエピトープ負荷の定量的評価も、大規模コホートでの実施が待たれていた。これらの知識ギャップを埋めることが、肺癌の病態理解と新規治療法開発に不可欠であると考えられた。
目的
本研究の目的は、過去最大規模となる660例の肺腺癌 (ADC) と484例の肺扁平上皮癌 (SqCC) の腫瘍-正常対エクソーム配列およびコピー数プロファイルを解析することである。これにより、両サブタイプにおける体細胞ゲノム変化の全体像を包括的に比較し、新規ドライバー遺伝子、変異シグネチャー、およびRTK-Ras-Raf経路の改変を同定する。さらに、免疫療法の適応を裏付ける根拠として、両サブタイプにおけるネオエピトープ負荷を定量的に評価することを目的とした。本研究は、肺ADCとSqCCの遺伝学的差異を明確にし、それぞれのサブタイプに特異的な治療標的の同定、および共通の免疫治療戦略の可能性を明らかにすることを目指した。
結果
両サブタイプ間の顕著な遺伝的乖離と新規ドライバー遺伝子の同定: MutSig2CV解析により、肺ADCで38遺伝子、肺SqCCで20遺伝子が有意変異遺伝子として同定された。両サブタイプで共通に有意変異だった遺伝子はTP53、RB1、ARID1A、CDKN2A、PIK3CA、NF1のわずか6遺伝子のみであり、重複率は12% (P = 0.105) であった (Fig. 1a)。他の癌種との比較では、肺ADCの有意変異遺伝子リストは膠芽腫および大腸癌と最も類似し (>13%重複、FDR q < 0.1)、肺SqCCは頭頸部扁平上皮癌および膀胱癌と最も類似した (>25%重複)。焦点的増幅ピークでは42のうち11峰のみが共通であり、焦点的欠損では50のうち13峰のみが共通であった (Fig. 1b, c)。これらの結果は、肺ADCとSqCCが遺伝学的に大きく異なる疾患であることを明確に示唆する。
新規有意変異遺伝子の同定: 肺ADC特異的新規ドライバーとしてPPP3CA (calcineurin触媒サブユニット) が同定された。PPP3CA変異はautoinhibitory domainにクラスターを形成し、KRAS変異との有意な共存 (P = 0.033) が認められたことから、活性化変異 (gain-of-function) であると考えられ、KRASシグナルとカルシウム依存性ホスファターゼ経路の協調的活性化を示唆する (Fig. 4a)。その他、DOT1L (H3K79メチルトランスフェラーゼ、ADCの約3%に截断変異で濃縮) およびFTSJD1 (キャップメチルトランスフェラーゼ、フレームシフト変異に濃縮) も新規ドライバーとして同定された。スプライシング因子U2AF1、RNA結合タンパクRBM10に加え、SF3B1、SNRPD3の反復変異も確認された。肺SqCC特異的新規ドライバーとしてRASA1 (p120GAP、フレームシフト変異に濃縮) が同定された (Fig. 4b)。Pan-lung (ADC+SqCC) 解析では、KLF5 (zinc-finger domain変異、HNSC・膀胱癌でも変異報告)、EP300、CREBBP (histone acetyltransferase domainにホットスポット変異、EP300/CREBBPは非重複変異で互いに補完的) など14の追加遺伝子が両サブタイプ共通の新規ドライバーとして同定された (Fig. 4c)。
変異シグネチャー解析と臨床的関連: NMFにより6つの変異シグネチャーが同定された。喫煙関連シグネチャーSI4 (C>A転換) は肺ADCで二峰性分布を示し、AUC = 0.87で非喫煙者を分類できた (Fig. 2a)。非喫煙者ADCの87%が「transversion low」(≤0.696 SI4 mutations/Mb) に分類された (P = 8.5 × 10^-37)。しかし、transversion-lowの肺ADCのうち、非喫煙者であったのは45%であった (Fig. 2b)。3例の肺SqCC (約1%) でUV関連シグネチャーSI7 (C>T at TCC/CCC) が認められ、これらの腫瘍は全変異率が他の肺腫瘍より有意に高く (P < 0.01)、うち1例は基底細胞癌の既往があり皮膚転移が示唆された (Fig. 2d)。また、7例 (ADC 4例・SqCC 3例) でMLH1発現低下と相関するミスマッチ修復 (MMR) 欠損シグネチャーSI15が認められた (P = 0.011) (Fig. 2e)。これらのMMR欠損腫瘍は、他の肺腫瘍と比較してSSNVsおよび短鎖インデルの発生率が有意に高かった (P < 0.001)。
新規コピー数異常と関連遺伝子: 肺ADCの新規増幅ピークとしてMIR21-TUBD1が同定された (Fig. 5c)。MIR21の発現は早期ADCの予後因子として報告されている。肺SqCCの新規増幅ピークとしてMIR205が同定された (Fig. 5d)。MIR205の発現はSqCCを他のNSCLCタイプと区別するために使用されており、このmiRNAの増幅が系統特異的な変化である可能性を示唆する。両サブタイプ共通の新規増幅ピークとしてMAPK1が同定された (Fig. 5c, d)。焦点的欠損では、B2M (β2ミクログロブリン) が両サブタイプで焦点的欠損および機能喪失型変異に濃縮されており (P < 0.01)、pan-lung解析で有意変異遺伝子として同定された (FDR q = 0.006)。
RTK-Ras-Raf経路の包括的評価: 肺ADCの76% (499/660例) がRTK-Ras-Raf経路に活性化変異、融合、または増幅を保有していた (Fig. 7c)。Oncogene-negative群 (n=242) では、SOS1 (4例でAsn233Tyr変異、autoinhibitory DH domain) やVAV1 (Ser67Tyr変異、GEF活性増強) などのRas/Rho経路制御因子の変異が有意に濃縮されており (Fisher’s exact test、FDR q < 0.1)、合計15遺伝子が同定された (Fig. 7a)。SOS1のAsn233Tyr変異は、Noonan症候群で報告されているAsp309Tyr変異と同様に、自己抑制ドメインに位置し、機能獲得型変異である可能性が示唆された。VAV1のSer67Tyr変異は、GEF活性を増加させることが示されている。さらに、KRAS変異とSTK11変異が有意に共存することも確認された (P = 1.1 × 10^-6)。RTK-Ras-Raf経路の既知または推定ドライバー遺伝子に変異を持つ腫瘍はn=499であった。
ネオエピトープ負荷と免疫療法の意義: HLAタイピングとpMHC親和性予測による解析で、肺ADCの47%およびSqCCの53%が5個以上の予測ネオエピトープを保有していた (Fig. 8b)。非同義変異数とネオエピトープ数は、ever-smoker間では両サブタイプで有意差なく (P > 0.05)、never-smoker ADCではever-smoker ADCより有意に低かった (P < 0.001、Wilcoxon rank-sum test) (Fig. 8a)。共通ネオエピトープ候補としてTP53 p.Val157Phe、PIK3CA p.Glu542Lys、C3orf59 p.Gln311Gluが少なくとも4腫瘍で同定された (Fig. 8c)。これらの結果は、両サブタイプにおける免疫療法の潜在的有効性を示唆する。
考察/結論
本研究は、肺ADCとSqCCが遺伝学的に本質的に異なる疾患であることを過去最大規模のコホートで証明した。両サブタイプ間で共通のドライバー遺伝子がわずか6遺伝子(12%重複)という事実は、両サブタイプへの画一的な治療戦略の限界を明確に示唆する。先行のTCGA研究(ADC 230例、SqCC 178例)と比較して大幅に増加したサンプルサイズにより、PPP3CA、DOT1L、RASA1などの低頻度(3〜5%)新規ドライバー遺伝子の検出が可能となり、統計的検出力の重要性が改めて示された。
先行研究との違い: これまでの研究では低頻度変異の検出が困難であったが、本研究では大規模コホートを用いることで、SOS1などの既報では検出されなかった低頻度変異を同定できた点が先行研究と異なる。また、肺SqCCの変異パターンが頭頸部扁平上皮癌や膀胱癌と類似する一方で、肺ADCとは大きく異なるという知見は、細胞発生学的起源に基づく癌の分類の重要性を強調する。
新規性: 本研究で初めて、肺ADC特異的ドライバーとしてPPP3CA、DOT1L、FTSJD1を、肺SqCC特異的ドライバーとしてRASA1を新規に同定した。また、Pan-lung解析によりKLF5、EP300、CREBBPが両サブタイプ共通の新規ドライバーとして検出された。RTK-Ras-Raf経路のoncogene-negative群におけるSOS1、VAV1、RASA1、ARHGAP35などの新たな経路制御因子変異の発見は、これまでの報告にはない新規性を持つ。
臨床応用: RTK-Ras-Raf経路改変が肺ADCの76%に存在するという包括的評価は、標的治療の網羅性を裏付け、oncogene-negative群での新たな経路制御因子変異の発見は、今後の治療標的開発の手がかりを提供する。ネオエピトープ解析による免疫療法適応の根拠提示は、PD-1/PD-L1抗体の肺癌承認への科学的根拠の一つとなった Brahmer et al. NEnglJMed 2015 Rizvi et al. Science 2015。SqCC (約1%) で発見されたUV関連シグネチャーは、臨床的に原発肺癌とされた症例が実は皮膚転移癌であった可能性を示唆し、病理診断への臨床的意義を持つ。
残された課題: 本研究の限界として、1患者1腫瘍サンプルの解析であり、腫瘍内不均一性 (intratumoral heterogeneity) は評価できなかった点が挙げられる。全エクソームシークエンシングでは非コード領域の変異や調節エレメント変異は捕捉されず、RNA-seq解析がない症例ではMETエクソン14スキッピングなどの融合遺伝子解析が不完全である可能性がある。肺ADCの15〜25%では依然として既知のRTK-Ras-Raf経路変異が検出されておらず、さらなる希少ドライバーの探索が今後の課題として残されている。また、変異率と生存・病期の関連は多重比較補正後には有意でなく、今後の前向きコホートでの検証が必要である。方法論上、新規コホートと既報コホートの統合解析では技術的バッチ効果が潜在的に交絡する可能性があり、MutSig2CVによる変異率補正の妥当性は継続的な評価が必要である。
方法
肺ADC 660例 (新規274例 + TCGA 227例 + Imielinski et al. 159例) および肺SqCC 484例 (新規308例 + TCGA 176例) の腫瘍-正常対エクソーム配列を解析した。DNAシーケンスはAgilent SureSelect Human All Exon 50Mbキットを用いたエクソームキャプチャー後、Illuminaペアエンドシーケンスにより実施された。リードのアライメントにはBWA、重複マーキングにはPicard tools、インデル周辺の再アライメントおよび塩基品質の再キャリブレーションにはGenome Analysis Toolkit (GATK) を使用した DePristo et al. NatGenet 2011。体細胞変異検出にはMuTectおよびIndelocatorを使用し、MutSig2CV (q < 0.1を有意とした) により有意変異遺伝子を同定した。MutSig2CV解析では、660例の肺ADCコホートで10%の変異遺伝子を検出する検出力は100%、5%の変異遺伝子を検出する検出力は73%であった。また、484例の肺SqCCコホートでは、10%の変異遺伝子を検出する検出力は100%、5%の変異遺伝子を検出する検出力は41%であった。これらの検出力は、それぞれ肺ADCで8.7 mutations/Mb、SqCCで9.7 mutations/Mbの変異率を仮定して計算された。コピー数変異の同定にはAffymetrix SNP6.0アレイデータを用い、GISTIC 2.0 Mermel et al. GenomeBiol 2011を適用した。変異シグネチャー抽出には、192変異型を用いた非負値行列因子分解 (NMF) を実施し、6つのシグネチャーを同定した。
新生抗原 (ネオエピトープ) 負荷は、POLYSOLVERによるHLAタイピングと、NetChop、NetMHC、NetMHCpan、SMM (Stabilized Matrix Method)、SMMPMBEC (Stabilized Matrix Method with Position-Specific Scoring Matrix and Motif-Based Scoring) などのアルゴリズムを用いたpMHC親和性予測により評価した。RTK-Ras-Raf経路解析では、既知の活性化変異を保有する腫瘍を「oncogene positive」(n=418)、それ以外を「oncogene negative」(n=242) に分類し、Fisher’s exact testを用いてoncogene-negative群で変異が濃縮されている遺伝子を探索した。RNAシーケンスデータは495例の肺ADCと476例の肺SqCCで利用可能であり、RSEM (RNA-Seq by Expectation-Maximization) Li et al. BMCBioinformatics 2011によりFPKM発現量を推定した。統計的比較には、Wilcoxon rank-sum test、Kruskal-Wallis test、Fisher’s exact test、およびCox proportional hazards modelを用いた。多重比較補正はBenjamini-Hochberg法により実施した。各腫瘍の純度とploidyはABSOLUTEを用いて推定した。