- 著者: André Kahles, Kjong-Van Lehmann, Nora C. Toussaint, Matthias Hüser, Stefan G. Stark, Timo Sachsenberg, Oliver Stegle, Oliver Kohlbacher, Chris Sander, The Cancer Genome Atlas Research Network, Gunnar Rätsch
- Corresponding author: Gunnar Rätsch (gunnar.ratsch@ratschlab.org, ETH Zurich / Memorial Sloan Kettering Cancer Center)
- 雑誌: Cancer Cell
- 発行年: 2018
- Epub日: 2018-08-02
- Article種別: Original Article
- PMID: 30078747
背景
選択的スプライシング (AS: alternative splicing) は正常発生において厳密に制御される一方、腫瘍では異常なAS景観が広範に観察されることが知られていた (Wang et al. NatGenet 2008)。TCGA (The Cancer Genome Atlas) は32癌種を超える大規模なRNA-seq + 全エクソーム解析 (WES: whole-exome sequencing) データを公開し、多癌種にわたる包括的トランスクリプトーム比較の基盤を提供してきた (CancerGenomeAtlasNetwork et al. Nature 2012)。それにもかかわらず先行研究では以下のギャップが欠けていた: (i) 標準化された統一手順での32癌種網羅的AS比較解析が不足していた、(ii) cis/trans両方のsQTL (splicing quantitative trait loci) を全ゲノム横断で系統的に同定した研究が欠けていた、(iii) SF3B1・U2AF1以外の体細胞変異がスプライシングをtrans制御するかの直接証拠が乏しかった、(iv) 腫瘍特異的なneojunctionがMHC-I結合性ペプチドを実際に産生するかの質量分析プロテオミクス的検証が完全に欠落していた。
スプライシング因子体細胞変異 (SF3B1、U2AF1) はuveal melanoma、MDS (骨髄異形成症候群: myelodysplastic syndrome)、CLL (慢性リンパ性白血病: chronic lymphocytic leukemia)、LUAD (肺腺癌) 等で既知のtrans-acting変異として確立しており、cis変異の例ではMET exon 14 skippingがMET阻害薬感受性を生じる。AS事象自体は腫瘍予後予測マーカーとしてもNSCLC・卵巣癌・乳癌・glioblastomaで報告されており、AS-derived neoantigenが免疫療法ターゲットとなる可能性が指摘されてきたが、その規模・spectrum・実質的なMHC-I (主要組織適合複合体クラスI: major histocompatibility complex class I) 提示確認は未検証で先行研究の重大な欠落であった。本研究はTCGA 32癌種8,705患者の規模で上記4ギャップを統合解析で埋めることを目的とする。
目的
TCGA 32癌種8,705患者のRNA-seqとWESデータを再解析し、(a) 腫瘍 vs 正常組織のAS景観の包括的比較、(b) 体細胞変異とAS事象を結ぶcis/trans sQTLの全ゲノム同定、(c) 腫瘍特異的neojunctionの規模・癌種分布の定量、(d) CPTAC (Clinical Proteomic Tumor Analysis Consortium) プロテオミクスによるneojunction由来ペプチドのMHC-I結合性確認、を行うこと。
結果
汎癌種AS景観と癌種クラスタリング: 32癌種で少なくとも20 spliced reads以上で確認できる高信頼度AS事象を検出し、GENCODE v19非収録イントロンを加えると総AS事象数は2倍以上に増加した (Fig. 2A、特にexon skip + alt 3’ でそれぞれ27.1%・27.5%が新規)。腫瘍は正常組織より最大30%多くのAS事象を保持し (Fig. 2B、各癌種でtumor n=40 vs normal n=40 matched)、特にLUAD (肺腺癌) で exon skip 30%超過、UCEC (子宮体癌) ・BLCA (膀胱癌) でも顕著。t-SNE可視化 (Fig. 2C, D) で癌種別クラスター形成が明示され、COAD-READペアやLUSC-CESC-HNSC扁平上皮系がgene expression以上に強く近接し、BRCA 4 subtype (luminal A/B、HER2+、basal) もexon skipプロファイルで分離する trajectory を形成した。matched normal は全癌種で対応する tumor と明確に分離した (Fig. S1M)。
sQTL解析と新規trans-acting splicing driverの同定: cis-sQTL 32件およびtrans-sQTL 7件が Bonferroni p < 0.05 で同定された (joint analysis, 50% prior on each)。既知のSF3B1・U2AF1 変異はそれぞれ多数のAS事象と強く関連し、SF3B1 では alternative 3’ 偏倚が確認された (Fig. 3C)。新規trans-sQTLとして同定されたのはTADA1 (transcriptional adapter 1)・PPP2R1A (protein phosphatase 2 scaffold subunit A α)・IDH1 (isocitrate dehydrogenase 1) であった。TADA1はSF3B5 (SF3B1のpartner) と相互作用しSF3B1類似のalt 3’ bias targetを示した (Fig. 3D)。PPP2R1A変異はSCRIB (tumor suppressor) のAS変化と関連し腫瘍化機序を示唆。IDH1変異はGBM/LGG/PCPGコホート内に絞っても377 AS事象に変化を生じ (Spearman correlation、Bonferroni p < 0.05、326 events; LGG only 243)、組織特異性ではなくIDH1のR-2-HG産生によるエピゲノム経路を介した広範なAS制御が示された。
腫瘍特異的outlier AS事象: 2,570件のoutlier AS事象 (936遺伝子) が同定され、PTEN exon 3 skippingが複数癌種で再現性高く検出された (tumor suppressor機能喪失の代替機序候補)。NDRG1・PKM (Warburg代謝鍵酵素)・BCL2L1 (apoptosis)・NUMB等の既知splicing-regulated 遺伝子も含まれた。複数癌種で同時多発する大規模再編 (chromothripsis類似の”splicing大量再編”) 概念が提示された。
Neojunction規模とMHC-Iペプチド確認: 平均約930 neojunction/腫瘍サンプル (全体で約251,000 unique events) が同定された。BLCA・UCEC・LUAD・BRCA・COAD で頻度が高い (癌種ごとに5-15倍の差)。CPTAC乳癌・卵巣癌プロテオームとの照合で1サンプル平均 1.7件のneojunction由来ペプチドがMS/MSで検出され (vs SNV由来 0.6件/sample、neojunction由来が 約2.8倍多い)、そのうちNetMHCpan予測 MHC-I 結合 (Kd < 500 nM) を満たすペプチドが含まれた。63 CPTAC samples中43 sample (68%、Fisher exact test p < 0.001) で少なくとも1件のCPTAC検出MHC-I結合neojunction由来ペプチドが存在。「putative neoantigen保有患者割合」はSNV単独で30%だが、neojunction (alternative splicing neoantigen: ASN) を追加すると75% (2.5-fold拡大) に到達することが推計された (Significance section)。
癌種別 neoantigen yield: SNV mutational burdenの低い癌種 (BRCA、OV) で特にneojunction由来 neoantigen の絶対寄与が大きく、SNV-rich なmelanoma / LUAD では SNV+neojunctionで上乗せ効果がより強かった。HLA型ごとの結合プロファイル分布も解析され、ASN候補は HLA-A02:01 + HLA-B07:02 で頻繁にrecover された。
考察/結論
本研究はTCGA 32癌種8,705患者・670 matched normalという前例のない規模で腫瘍AS landscapeを構築し、4つの統合解析 (sQTL + tumor vs normal比較 + outlier + neojunction proteomic confirmation) を一貫した workflow で実施した点が新規 (novel)な貢献である。先行のpan-cancer SF3B1/U2AF1解析と異なり、本研究は新規trans-acting driver (TADA1・PPP2R1A・IDH1) を同定し、IDH1変異がR-2-HG経由のエピゲノム機序で広範なAS変化を生むという仮説に直接的根拠を与えた。
臨床応用・bench-to-bedside translation: 最重要発見はalternative splicing neoantigen (ASN) によるネオアンチゲン陽性患者割合の30%→75% 2.5倍拡大であり、これはSNV mutational burden が低い癌種 (BRCA・OV等) での個別化tumor vaccine設計に直接活用できる。ASN候補ペプチドは CPTAC MS/MSで実検出が確認されMHC-I 結合性も満たすため、in silico 予測のみに頼らない proteomic evidence-based neoantigen pipelineへ移行可能となる。PTEN exon 3 skippingのような複数癌種共通のoutlier ASは、tumor suppressor機能喪失の代替機序として機能的意義を持つ可能性があり臨床的バイオマーカー候補となりうる。
先行研究との比較・整合性: 先行のsmaller cohort AS解析 (NSCLC単独、卵巣癌単独) と対照的に、本研究は32癌種を統一手法で並列解析することでcross-cancer subtype同質性 (LUSC-HNSC-CESC等) を明示し、tissue-of-originを超えるpan-cancer subgroupingが gene expression よりAS profile でより鋭利に達成できることを示した点が新規である。SF3B1 既知効果との整合性 (alt 3’ bias) を確認した一方、TADA1 が SF3B5 経由でSF3B1類似 target を持つという仮説は本研究初提出である。
限界・残された課題: (i) neojunction の一部が正常組織で低頻度に存在する可能性 (特異性問題、GTExでも極稀に検出)、(ii) neojunction由来ペプチドの免疫原性 (実際にCTL応答を誘導するか) の機能的検証が残された、(iii) 患者個別のHLA型適合性は in silico 予測のみで in vivo 反応は未測定、(iv) 腫瘍内不均一性 (intratumoral heterogeneity) によるclonal vs subclonal neojunction区別の解析手法が不足、(v) CPTAC データは BRCA + OV 2癌種に限定、他癌種への拡張 proteomics 検証が残された課題、(vi) RNA-seq depth が低い古い TCGA sample では低頻度junction を検出漏れする可能性が残る、(vii) bulk RNA-seq に依存するため single-cell解像度での splicing heterogeneity は未解析。これらの課題は ASN-based免疫療法の臨床transl展開に向けて段階的解決が必要である。Kahles et al.のSPLAdder + 解析データセットは公開され、後続の多数のAS・ASN研究の community resource となった。
方法
コホート構成: TCGA RNA-seqデータ8,705患者 (32癌種、うちmatched normal 670例、WES並列利用可)、独立比較対象としてGTEx (Genotype-Tissue Expression) 正常組織RNA-seq、CPTAC乳癌 (BRCA) ・卵巣癌 (OV) のMS/MS (mass spectrometry/mass spectrometry) プロテオームデータを統合利用。
RNA-seq前処理とAS定量: STAR alignerでhg19へreference alignment、SAMtoolsでBAM処理。SPLAdder (splicing graph based detector、Kahles et al. 2016) で各サンプル単位のスプライシンググラフを構築し、AS事象を網羅検出。各junctionの信頼度は最低20 spliced reads (default high-confidence) または5 readsの2 thresholdで検証。PSI (Percent Spliced In) 値で各AS事象を定量化、ΔPSIで比較。
Variant calling・sQTL解析: WES由来体細胞SNV (single nucleotide variant) はTCGA Multi-Center Variant Call (MC3) projectのconsensus callsを使用。AS-variant連関解析はLIMIX linear mixed model (population/tissue/batch effects補正) で、上限8,255 donor、合計94,749 exon skip + 30,755 alternative 5’ + 48,365 alternative 3’事象 (計173,869 events) をphenotypesとして登録。cis (1 Mb window内) と trans (それ以上) を50%事前確率で同時推定、Bonferroni-corrected p < 0.05 を有意水準とした。Mutational load との交絡をp < 0.01フィルタで除外 (SF3B1/U2AF1は除外免除)。
Neojunction同定・neoantigen予測: GTEx正常組織で≤1患者にしか検出されない junction をtumor-specific neojunctionと定義。NetMHCpan 4.0でMHC-I (major histocompatibility complex class I) 結合予測 (Kd < 500 nM)、CPTAC MS/MSペプチド検索で実検出を確認 (BRCA + OV計63 sample)。
Outlier AS解析: 腫瘍サンプル内で他のTCGAサンプルと比較し統計的外れ値 (z-score 高) を示すAS事象を「outlier events」として同定、再現性遺伝子を抽出。t-SNE (Van der Maaten & Hinton 2008) でAS景観の癌種間類似性を可視化。
統計: Spearman相関、Bonferroni補正、permutation testを用途別に併用。データとSPLAdderツールはGitHub公開でcommunity resource化。