• 著者: Michael Seiler, Shouyong Peng, Anant A. Agrawal, James Palacino, Teng Teng, Ping Zhu, Peter G. Smith, The Cancer Genome Atlas Research Network, Silvia Buonamici, Lihua Yu
  • Corresponding author: Silvia Buonamici (silvia_buonamici@h3biomedicine.com), Lihua Yu (lihua_yu@h3biomedicine.com) (H3 Biomedicine, Inc., Cambridge, MA)
  • 雑誌: Cell reports
  • 発行年: 2018
  • Epub日: 2018-02-20
  • Article種別: Original Article (Pan-Cancer Atlas)
  • PMID: 29617667

背景

メッセンジャーRNA前駆体の選択的スプライシング (alternative pre-mRNA splicing) は、哺乳類細胞におけるトランスクリプトームおよびプロテオームの多様性を生み出す主要な機構である。この過程は、5つの小核リボ核タンパク質 (snRNP) 複合体と150種類以上のタンパク質から構成される巨大な分子機械スプライソソーム (spliceosome) によって極めて精密に制御されている。2011年に骨髄異形成症候群 (MDS) において、SF3B1、SRSF2 (serine/arginine-rich splicing factor 2)、U2AF1、ZRSR2 (zinc finger CCCH-type, RNA binding motif and serine/arginine rich 2) といったスプライシング因子遺伝子に高頻度かつ再発性の体細胞変異 (somatic mutation) が発見されて以来 (Yoshida et al. Nature 2011)、血液悪性腫瘍を中心にスプライシング因子の異常が発がんドライバーとして注目を集めてきた。慢性リンパ性白血病 (CLL) におけるSF3B1変異の同定 (Wang et al. Nature 2011) や、ぶどう膜黒色腫 (UVM) におけるSF3B1 R625変異の予後との関連など、固形腫瘍の一部でもその重要性が報告されつつあった。

しかしながら、これまでの先行研究には以下の重大なギャップが存在していた。第一に、固形腫瘍を含む多がん種 (pan-cancer) 規模でのスプライシング因子変異の体系的なランドスケープが完全に欠落しており、系統的な解析が未解明であった。第二に、どのスプライシング因子遺伝子が真の発がんドライバー (bona fide driver) として機能しているのか、全ゲノム規模の統計的フィルタリングを用いた評価が不十分であり、決定的な知見が不足していた。第三に、変異によって誘導される異常スプライシングが、がん種の系統に依存するもの (lineage-specific) か、あるいは系統に依存しない共通の現象 (lineage-independent) であるのかの検証が決定的に不足していた。第四に、異常スプライシングがもたらす細胞自律的なシグナル経路への影響や、腫瘍微小環境における免疫浸潤などの非細胞自律的帰結との関連が未解明であった。これらの知識ギャップは、スプライシング異常を標的とした精密医療 (splicing-targeted precision oncology) の戦略確立を阻む大きな課題となっていた。

目的

本研究は、がんゲノムアトラス (TCGA) プロジェクトが蓄積した33のがん種、10,000例を超える大規模コホートの全エクソームシーケンス (WES) およびRNAシーケンス (RNA-seq) データを統合的に解析し、以下の目的を達成することを目指した。 (a) スプライシング因子遺伝子における体細胞変異の網羅的なランドスケープを全がん種横断的に描出する。 (b) 統計的アルゴリズムを用いて、真のスプライシング因子ドライバー遺伝子を厳格に同定する。 (c) SF3B1、U2AF1、SRSF2などの主要なホットスポット変異、およびRBM10、FUBP1 (far upstream element binding protein 1) などの機能喪失型 (LoF) 変異がもたらす異常スプライシングイベントを定量化し、その系統依存性・非依存性を検証する。 (d) スプライシング因子変異が細胞自律的ながんシグナル経路や、腫瘍微小環境における免疫細胞浸潤に与える影響を解明する。 (e) スプライシングモジュレーター薬の臨床応用を見据え、治療標的となり得るがん種スペクトラムを定義する。

結果

119個のスプライシング因子ドライバー遺伝子の同定: MutSigCV解析により、少なくとも1つのがん種コホートにおいて68個の遺伝子が有意に変異していると判定された (q 0.1)。これにRatiometric法によるホットスポット/LoFパターンの解析結果を統合することで、最終的に119個のスプライシング因子遺伝子が発がんドライバー候補として同定された (Fig. 1)。このリストには、SF3B1、SRSF2、U2AF1、ZRSR2といった既知のコアスプライシング因子に加え、TADA1 (transcriptional adaptor 1)、PPP2R1A、RBM10、PCBP1などの新規ドライバー候補が含まれている。

がん種別の変異頻度とBLCAおよびUVMにおける過剰蓄積: 33がん種におけるスプライシング因子変異の分布を解析したところ、膀胱がん (BLCA) とぶどう膜黒色腫 (UVM) において、バックグラウンド変異率から期待される統計的予測値を大幅に超えてスプライシング因子のドライバー変異が濃縮していることが明らかになった (BLCA: p=0.01, UVM: p=0.03, フィッシャー正確検定)。具体的な頻度として、UVMでは SF3B1 ホットスポット変異 (主に p.R625H/C/L) が約 20% (n=16/80) に認められ、皮膚黒色腫 (SKCM) でも同様の変異が検出された (Network et al. Cell 2015)。また、肺腺癌 (LUAD) や膀胱がん (BLCA) では RBM10 のLoF変異が高頻度に同定された (Fig. 1)。

SF3B1ホットスポット変異による系統非依存的な異常3’スプライス部位選択: SF3B1変異は、C末端のHEATリピートドメイン (HD) 4-8にクラスターを形成する既知のホットスポット (p.K700Eなど) に加え、本研究では新たにHD 11の p.E902K (BLCA特異的) やHD 12の p.R957 (UCEC特異的) などの新規ホットスポットを同定した (Fig. 2)。主成分分析 (PCA) において、HD 4-8変異を持つサンプルは野生型と明瞭に分離し、一貫した隠生的3’スプライス部位 (cryptic 3’SS) の選択異常を示した (Fig. 2C)。BLCAにおける SF3B1 p.E902K 変異サンプル (n=6) のRNA-seq解析では、134箇所の有意なオルタナティブジャンクションが同定され (Fig. 2D)、HD 4-8変異とは異なり、カノニカルな3’SSの下流に位置する隠生的3’SSを優先的に使用するという独自の分子表現型が示された (Fig. 2E)。

U2AF1およびSRSF2変異における配列特異的なスプライシング制御: U2AF1 p.S34F/Y 変異は、LUAD (n=15) およびLAML (n=6) において、3’SSのAGジヌクレオチドの直前 ( -1 位) の塩基選択性をシフトさせ、カセットエキソンの導入またはスキッピングを誘導した (Fig. 3B, 3C)。また、SRSF2 p.P95変異およびインフレーム欠失は、UVM (n=2) においてエキソンスプライシングエンハンサー (ESE) の認識配列を CCNG から GGNG へと偏向させ、EZH2やBCORなどの標的遺伝子で異常なエキソン取り込みを引き起こした (Fig. 3E, 3F)。

主要スプライシング因子変異の相互排他性と系統非依存性: SF3B1、SRSF2、U2AF1、ZRSR2のホットスポット変異は、全がん種において極めて厳格な相互排他性 (mutual exclusivity) を示した (p<0.001, フィッシャー正確検定, オッズ比 0.05-0.15)。これは、単一のスプライシング因子異常で腫瘍の生存・増殖に必要なスプライソソーム機能の変容が十分に達成され、複数の変異共存は合成致死 (synthetic lethality) を招くため陰性選択されていることを示唆する。さらに、同一の変異 (例: SF3B1 K700E) は、UVM、BLCA、LUAD、PAADなどの異なる組織系統を越えて極めて類似した異常スプライシングパターンを誘導し (がん種間の相関 Spearman r=0.75)、系統に依存しない直接的な分子帰結であることが証明された。

RBM10およびFUBP1の機能喪失型変異によるスプライシング抑制の解除: LUAD (n=32) およびBLCAにおける RBM10 のLoF変異は、RBM10のmRNA発現低下を伴い (Fig. 4B)、広範なエキソン取り込み (exon inclusion) と、それに隣接するイントロン保持 (intron retention) の減少を誘発した (Fig. 4C, 4D)。FUBP1 のLoF変異は、低悪性度神経膠腫 (LGG, n=30) において染色体1p/19q共欠失およびIDH1変異背景と強く相関し、ATに富むエキソンのスキッピング異常を誘導した (Fig. 5A, 5B)。U87MG細胞を用いた FUBP1 ノックダウン実験 (n=3 replicates) では、患者サンプルで観察されたスプライシング変化が再現され、FUBP1喪失による直接的な効果であることが実証された (Fig. 5D)。RBM10のLoF変異は、Student t-test 等の統計解析 (p<0.001) で有意な 2.5-fold increase 以上のカセットエキソン導入や log2FC 1.8 以上のオルタナティブ3’スプライス部位選択を誘発した。

下流シグナルパスウェイの脱制御と腫瘍微小環境における免疫逃避: GSEA解析により、スプライシング因子変異は細胞自律的なパスウェイ (DNA損傷応答の低下、アポトーシス抵抗性、プロテアソームおよびリボソーム活性の亢進) を有意に活性化することが示された (Fig. 6B, 6C)。さらに、非細胞自律的な影響として、MHC class I 抗原提示経路 (HLA-A/B/C、TAP1/2など) の協調的な発現低下が確認された。CIBERSORTを用いたTIL組成のデコンボリューション解析では、スプライシング因子変異群においてCD8+ T細胞の浸潤が約 25% 減少し、制御性T細胞 (Treg) が約 18% 増加、M2マクロファージが約 30% 増加するという免疫抑制的な微小環境の形成が示された (Fig. 6B)。この免疫浸潤の低下は、がん細胞株の解析では観察されず、患者腫瘍組織に特異的な非細胞自律的表現型であることが確認された (Fig. 6D)。

考察/結論

先行研究との違い: 本研究は、Yoshidaら (Yoshida et al. Nature 2011) が血液悪性腫瘍においてスプライシング因子変異を初めて同定した知見を、固形腫瘍を含む33のがん種・1万例以上の大規模コホートへと拡張した点で決定的に異なる。従来の単一がん種を対象としたTCGA個別解析 (Network et al. Nature 2012, Cancer et al. Nature 2014) とは対照的に、統一されたパイプラインを用いて全がん種を横断的に並列解析したことで、スプライシング因子変異間の厳格な相互排他性や、組織系統を超えた異常スプライシングの共通性 (lineage independence) を初めて直接検証することに成功した。また、同年に発表されたKahlesらのスプライシング研究 (Kahles et al. CancerCell 2018) がオルタナティブスプライシングイベント全体のカタログ化に焦点を当てていたのに対し、本研究はゲノム変異と直結したドライバー遺伝子の同定およびその下流パスウェイの機能解明に特化しており、極めて補完的な関係にある。

新規性: 本研究は、全ゲノム規模の統計的フィルタリングにより、がんゲノムにおける119個のスプライシング因子ドライバー遺伝子を新規に同定した。特に、膀胱がん (BLCA) において SF3B1 p.E902K 変異が独自の隠生的3’SS選択異常を誘導すること、および低悪性度神経膠腫 (LGG) において FUBP1 の機能喪失型変異がAT含有エキソンのスプライシング異常とMYC標的遺伝子の発現低下を誘導することを初めて明らかにした。さらに、スプライシング因子の変異が単なる細胞自律的な増殖シグナルの変容に留まらず、MHC class I の発現低下や腫瘍浸潤CD8+ T細胞の減少を伴う免疫微小環境の抑制的変容 (免疫逃避) を誘導するという新規の病態生理学的連関を提示した。

臨床応用: 本研究の知見は、スプライシング異常を標的とした精密医療の臨床応用に強固な根拠を提供する。第一に、SF3B1変異体を標的とする選択的スプライソソームモジュレーター (H3B-8800やE7107など) に対する合成致死性を利用した治療戦略において、血液がんだけでなく、SF3B1変異を有するUVM、BRCA、BLCAなどの固形腫瘍患者を治療対象として選択するバイオマーカーの確立に直結する。第二に、異常スプライシングによって生じるジャンクションペプチドは、正常組織には存在しないがん特異的なネオアンチゲン (neoantigen) の有望なソースであり、個別化がんワクチンやT細胞療法の開発に向けた臨床的有用性が高い。第三に、スプライシング因子変異に伴うMHC-I低下と免疫抑制微小環境は、免疫チェックポイント阻害剤 (ICI) に対する耐性機序を説明するものであり、スプライシングモジュレーターとICIの併用療法の合理的な根拠 (rationale) となる。

残された課題: 今後の検討課題として、いくつかの制限 (limitation) が挙げられる。第一に、本研究で使用されたTCGAデータはショートリードRNA-seqに基づいており、複雑なアイソフォーム全体の構造やイントロン保持の全容を完全に解明するには限界がある。今後はロングリードシーケンス技術を用いたアイソフォームレベルでの検証が必要である。第二に、同定された119個のドライバー遺伝子のうち、詳細な機能検証が行われたのはSF3B1やRBM10などの一部に留まっており、残る100個以上の遺伝子における異常スプライシングの標的分子や機能的意義の解明が不足している。第三に、スプライシング因子変異による免疫微小環境の変容について、マウスモデル等を用いた生体内 (in vivo) での直接的な因果関係の検証が今後の重要な研究方向性である。

方法

スプライシング因子遺伝子リストの構築: 文献情報、プロテオーム解析データ、およびデータベース (SpliceosomeDB) を統合し、snRNPコアサブユニット、SRタンパク質、hnRNP、スプライシング制御因子、ポリアデニレーション因子などを網羅する404個のスプライシング因子遺伝子からなる手作業でキュレートされたカタログを構築した。

解析コホートとシーケンスデータ: TCGA Pan-Cancer Atlasの33がん種、合計10,389例の患者から得られたWESおよびRNA-seqデータを並列で解析した。コホートには、膀胱がん (BLCA, n=409)、ぶどう膜黒色腫 (UVM, n=80)、肺腺癌 (LUAD, n=566)、乳がん (BRCA, n=1,098)、膵腺癌 (PAAD, n=185) などが含まれる。体細胞変異の検出には、TCGA Multi-Center Variant Call (MC3) プロジェクトのコンセンサス変異コールデータを使用した。

ドライバー遺伝子の同定アルゴリズム:

  1. MutSigCV: バックグラウンド変異率、遺伝子サイズ、複製タイミング、遺伝子発現レベルを調整した統計的有意性判定を行い、q値 0.1 を満たす遺伝子を抽出した (Lawrence et al. Nature 2013)。
  2. Ratiometric法: 同一コドンに再発するホットスポット (HS) 変異の割合からオンコジーン様パターンを、機能喪失型 (LoF) 変異の割合からがん抑制遺伝子様パターンを識別した (Vogelstein et al. Science 2013)。これらを統合し、さらに20/20+アルゴリズムによる検証を加えてドライバー遺伝子を確定した。

異常スプライシング解析: STARアライナー (Dobin et al. Bioinformatics 2013) を用いてRNA-seqリードをゲノムにマッピングし、スプライスジャンクションのPSI (percent spliced-in) を算出した。変異保有サンプルと野生型 (WT) サンプルをlimmaパッケージ (Ritchie et al. NucleicAcidsRes 2015) で比較し、偽発見率 (FDR) 補正q値 < 0.05 かつ ΔPSI 閾値 >= 0.1 を満たす有意なオルタナティブスプライシングイベントを同定した。

パスウェイおよび免疫微小環境解析: 遺伝子セット濃縮解析 (GSEA) (Subramanian et al. ProcNatlAcadSciUSA 2005) を用いて、細胞自律的パスウェイの変動を評価した。さらに、CIBERSORTアルゴリズム (Newman et al. NatMethods 2015) を用いて、RNA-seqデータから腫瘍浸潤白血球 (TIL) の22種類の組成をデコンボリューション推定した。

FUBP1ノックダウン検証実験: ヒト膠芽腫細胞株 U87MG (n=3 replicates) に対し、FUBP1を標的とするsiRNA (small interfering RNA) または非標的コントロールsiRNAを導入した。ノックダウン効率をウエスタンブロットで確認後、ポリA選択RNA-seqを実施した。統計解析には Student t-test を用いて、患者データから得られたスプライシング変化との一致度を検証した。