• 著者: Nicolas Stransky, Ethan Cerami, Stefanie Schalm, Joseph L. Kim, Christoph Lengauer
  • Corresponding author: Christoph Lengauer (Blueprint Medicines, Cambridge, Massachusetts 02142, USA)
  • 雑誌: Nature Communications
  • 発行年: 2014
  • Epub日: N/A
  • Article種別: Original Article
  • PMID: 25204415

背景

キナーゼ遺伝子融合は、血液悪性腫瘍においてBCR-ABL1やPML-RARA (promyelocytic leukemia-retinoic acid receptor alpha) などの代表的な例がよく研究されており、イマチニブ、クリゾチニブ、セリチニブといった対応する標的治療が臨床に確立されている。これらの融合遺伝子は、染色体転座やその他の再配列によって産生され、そのタンパク質産物はがん治療薬開発の理想的な標的となることが多い。例えば、イマチニブはBCR-ABL1融合陽性の白血病患者に寛解を誘導し、クリゾチニブやセリチニブは、未分化リンパ腫キナーゼ (ALK) 融合を有する肺癌や間葉系腫瘍患者において顕著な臨床的利益をもたらしていることが報告されている Shaw et al. NEnglJMed 2013 Shaw et al. NEnglJMed 2014

固形腫瘍においても、非小細胞肺癌 (NSCLC) におけるEML4-ALK融合 Soda et al. Nature 2007や、前立腺癌におけるTMPRSS2-ERG融合など、いくつかの融合遺伝子が同定されてきた。しかし、多数のがん種を横断した体系的な融合遺伝子の網羅的調査はこれまで行われていなかった。次世代シーケンシング技術の進歩により、DNA解析を通じて大規模な腫瘍パネルのゲノム特性評価が可能になった一方で、固形腫瘍における遺伝子融合のランドスケープに関する理解は不完全なままであった。

RNAシーケンス (RNA-seq) の大規模普及とThe Cancer Genome Atlas (TCGA) プロジェクトの進展により、数千もの癌トランスクリプトームがRNA-seqによって評価され、公的に利用可能となり、固形腫瘍の大規模コホートでの融合遺伝子探索が初めて実現可能となった。キナーゼ遺伝子融合は、融合タンパク質のキナーゼ活性の恒常的活性化を介して発癌ドライバーとして機能し、チロシンキナーゼ阻害剤 (TKI) による治療標的として極めて重要である。既知の治療可能キナーゼ融合の頻度を明らかにし、新規融合を体系的に同定することは、精密医療の適応拡大に不可欠な情報であった。しかし、大規模なRNA-seqデータセットを用いた固形腫瘍におけるキナーゼ融合の包括的な解析は未解明な点が多かった。特に、既知の癌遺伝子における新規の活性化メカニズムや、これまで腫瘍形成との関連が知られていなかったキナーゼにおける新規融合の同定は、依然として不足している状況であった。この知識ギャップを埋めることが、本研究の重要な動機付けである。

目的

本研究の目的は、TCGAの大規模RNA-seqデータセットに独自の融合検出パイプラインを適用し、約7,000の固形腫瘍サンプルにおける再発性キナーゼ融合イベントを網羅的に同定することである。さらに、各融合の臨床的・生物学的意義を評価し、既存の承認薬を含む治療標的としての可能性を検討することを目指した。具体的には、既知の癌遺伝子 (例: MET、PIK3CA) における新規の活性化メカニズムとしての融合イベントや、これまで腫瘍形成との関連が知られていなかったキナーゼ (例: FGR (feline Gardner-Rasheed sarcoma viral oncogene homologue)、PKN1 (protein kinase N1)) における新規再発性融合の発見に焦点を当てた。これにより、がんのゲノムランドスケープに関する理解を深め、がん診断と治療に直接的な影響を与える新たな知見を提供することを意図した。

結果

再発性キナーゼ融合の全体頻度とがん種間差異: 解析した6,893サンプルのうち、全体の3.0%にあたるサンプルで再発性キナーゼ融合が同定された。がん種間で融合頻度には極めて顕著な差異が認められ、肉腫コホートでは1サンプルあたり0.57個と最も高い融合発生率を示したものの、そのうち再発性のキナーゼ融合であったのは12%のみであった。これに対し、甲状腺癌と膠芽腫では平均融合頻度自体は低いものの (それぞれ1サンプルあたり0.19個および0.23個)、検出された融合のうち再発性融合が占める割合がそれぞれ67%および36%と非常に高く、これらの癌種におけるキナーゼ融合の病態生理学的な重要性が示唆された (Fig. 1)。がん種別の再発性融合頻度は0%から12.9% (中央値2.1%) の範囲に分布しており、淡明型腎細胞癌および嫌色素性腎細胞癌では再発性融合は一切検出されなかった。

既知融合の再確認と新規がん種における検出: 本解析パイプラインは、既報の代表的な融合遺伝子を正確に再検出した。EML4-ALK融合は肺腺癌の約1% (n=5/513) で検出され、甲状腺癌 (n=3/498) でも複数のALK融合が同定された。さらに、新規のALK融合として膀胱癌でTPM1-ALK、直腸腺癌でSMEK2-ALK、甲状腺癌でGTF2IRD1-ALKが同定された (Fig. 1)。ROS1融合は肺腺癌 (n=8/513) で既知パートナーとの融合が検出されたほか、膠芽腫においてCEP85L-ROS1融合が新規に検出された (Fig. 1)。RET融合では、甲状腺癌における既知のCCDC6-RETのほか、新規パートナーとしてAKAP13、FKBP15、SPECC1L、TBL1XR1が同定され、計4種のがん種でRET融合が確認された (Fig. 1)。BRAF融合は悪性黒色腫や甲状腺癌など広範ながん種で検出され、新規のATG7-BRAF、ZC3HAV1-BRAF、FAM114A2-BRAF融合も同定された (Fig. 1)。RAF1融合では、甲状腺乳頭癌の1.4% (n=7/498) においてAGGF1-RAF1融合が新規に同定された (Fig. 1)。FGFR3-TACC3融合は20がん種中8がん種で検出され、新規適応として乳頭状腎細胞癌での融合が発見された (Fig. 1)。NTRK1-3融合は20がん種中9がん種で計n=23例同定され、低頻度ながら汎がん種イベントとして存在することが示された (Fig. 1)。PRKCA (protein kinase C, alpha) 融合は肺扁平上皮癌でIGF2BP3-PRKCAとTANC2-PRKCAが検出され、融合陽性サンプルではPRKCA mRNA発現のzスコアが6.8および2.6と著明な高値を示した。

既知癌遺伝子における新規キナーゼ融合イベント: METは乳頭状腎細胞癌などで体細胞変異が報告されている既知の癌遺伝子であるが、本研究は一次腫瘍サンプルにおける再発性MET融合を初めて報告した。腎乳頭細胞癌において、BAIAP2L1-METとC8orf34-METの2種のin-frame融合が同定され、これらの二量体化ドメインがMETの恒常的活性化を誘導すると推定された (Fig. 2)。肺腺癌でKIF5B-MET、甲状腺癌でTFG-METも同定された。一方、PIK3CAはミスセンス変異が高頻度で認められるが、融合による活性化は知られていなかった。本研究では、乳癌 (n=2/1,072) でTBL1XR1-PIK3CA、子宮体癌 (n=1/166) でFNDC3B-PIK3CAを同定した (Fig. 1)。いずれの融合産物もPIK3CAの完全なコーディング配列を保存し、パートナー遺伝子の5’非翻訳領域 (5’ UTR) によるプロモーター融合のメカニズムで、PIK3CA mRNA発現が当該がん種内で最高レベルに達していた (Fig. 3)。

従来腫瘍形成に関連しないキナーゼにおける新規再発性融合: SrcファミリープロテインチロシンキナーゼであるFGRが、肺扁平上皮癌、卵巣漿液性嚢胞腺癌、皮膚悪性黒色腫の3がん種でWASF2-FGR融合として同定された。全例で完全に同一のブレークポイントを持ち、染色体1p上の近接遺伝子のタンデム重複によりWASF2の5’ UTRとFGR全長コーディング配列が連結していた。n=3例全てでFGR mRNAが当該がん種内で最高レベルで発現しており、プロモーター融合による過剰発現が示唆された。また、PKN1融合として、肺扁平上皮癌でANXA4-PKN1、肝細胞癌でTECR-PKN1を同定した (Fig. 1)。いずれの融合産物でもPKN1のN末端調節ドメインが欠失しており、Caspase-3切断部位近傍のブレークポイントと相まって、キナーゼの恒常的活性化が予測された。mRNA発現は各がん種内で最高レベルであった。

甲状腺癌における変異排他的融合パターンとTRIO-TERT融合: 甲状腺癌 (n=498) では、ALK、BRAF、MET、NTRK1、NTRK2、RAF1、RETの全キナーゼ融合が相互に完全に排他的であり (Fig. 4)、かつBRAF V600E変異やRAS変異とも排他的であることが確認された。これらのキナーゼ融合が甲状腺癌のドライバーであり、それぞれが独立した発癌経路を代表することを強く支持する。また、脱分化型脂肪肉腫の5% (n=2/38) で、TRIOの非キナーゼ領域がTERT (telomerase reverse transcriptase) に融合し、TERT mRNA発現が他サンプルの約100倍 (fold change 100.0x, p<0.001) に達していることが示された (Fig. 5)。これは、テロメラーゼ再活性化の第3の新規ゲノム機序として提示された。

考察/結論

本研究は、TCGA RNA-seqデータ約7,000サンプル (20固形腫瘍種) を活用し、固形腫瘍の大規模コホートでキナーゼ融合の網羅的ランドスケープを初めて確立した先駆的研究である。TCGAデータの組織横断的活用という方法論的アプローチ自体が、がんゲノム解析の新たな方向性を示した。全体の3.0%のサンプルに再発性キナーゼ融合が同定されたが、がん種間で最大13%まで頻度差があり、特に甲状腺癌では67%が再発性融合であり、キナーゼ融合が特定のがん種のドライバーとして中心的な役割を果たすことが確立された。

先行研究との違い: これまでの研究では、特定の癌種における既知の融合遺伝子に焦点が当てられることが多かったが、本研究はがん種を横断した大規模なRNA-seq解析により、これまで報告されていない新規のキナーゼ融合や、既知の癌遺伝子における新たな活性化メカニズムを体系的に同定した点で、これまでの研究とは対照的である。特に、NTRK1-3融合が9がん種で計23例と低頻度ながら汎がん種イベントとして存在するという発見は、その後のpan-NTRK阻害薬の開発と承認を先取りした知見であり、本研究の予測的な価値を強く示唆している。

新規性: 本研究で初めて、(1) 既知の強力な癌遺伝子 (MET、PIK3CA) への初の融合イベント、(2) 従来腫瘍形成に関連しないキナーゼ (FGR、PKN1) への新規再発性融合、(3) 甲状腺癌における変異排他的な高融合頻度、の3大発見を新規に同定した。これらはそれぞれ、がんのゲノムランドスケープに関する理解を深め、精密医療の実装に直結する重要な知見である。例えば、PIK3CAのプロモーター融合は、これまで点変異やコピー数増加で活性化されると考えられていたPIK3CAの新たな活性化メカニズムを示した。

臨床応用: 本知見は、既承認薬 (クリゾチニブなど) が新たに同定された融合を持つ患者 (異なるがん種) に適応可能であることを示唆し、がん種横断型バスケット試験の理論的根拠を提供した。PIK3CA融合の発見は、PI3K/AKT/mTOR阻害薬の適応候補拡大を示す。また、本研究が用いたフィルタリング手法 (TCGA正常647サンプルおよびGTEx 1,750正常サンプルでの偽陽性除去) は、現在の融合遺伝子検出パイプラインの標準的アプローチとして広く採用されており、臨床現場におけるゲノム診断精度の向上に貢献している。

残された課題: 今後の検討課題として、MET、PIK3CA、FGRなどの新規融合の機能的発癌ドライバー性の生化学的検証、各融合に対応する治療薬の感受性確認、液体生検を活用した融合検出の臨床実装、単一がん種では希少な融合のバスケット試験デザインの最適化、および甲状腺癌以外のがん種での変異排他性の系統的検証が挙げられる。PKN1やFGRなどの従来腫瘍形成と非関連のキナーゼへの融合については、それぞれの標的治療薬の開発と感受性確認を要する今後の課題である。

方法

データセットと融合検出パイプライン: TCGA RNA-seqデータ6,893サンプル (20固形腫瘍種、うち肉腫103例はprovisional data) を対象とした。すべての利用可能な未アラインRNA-seqデータファイル (fastqファイル) はCGHub (Cancer Genomics Hub) から取得された。アライメントにはSTAR v2.3.1qアライナー Dobin et al. Bioinformatics 2013を使用し、hg19/Gencode v17にマッピングした。STARは、各リード長に対応する異なるゲノムインデックスを生成し、キメラリード (ペアエンドが異なる遺伝子にマップ) とスプリットリード (融合点にまたがるリード) を特定した。

融合検出アルゴリズムとフィルタリング: STARアライナーの出力から、PythonライブラリHTSeq-0.5.4p1 Anders et al. Bioinformatics 2015とGencode v17トランスクリプトームアノテーションを用いて、タンパク質融合候補を同定した。特異性を向上させるために以下のフィルタリング基準を適用した。(1) 5’→3’の方向性の一致、(2) 相同配列による偽陽性除外、(3) キメラリード数とスプリットリード数のカットオフ: 2つ以上のスプリットリードが存在する場合は5つ以上のキメラリード、1つのスプリットリードの場合は10個以上のキメラリード、スプリットリードがない場合は20個以上のキメラリードを要求した。(4) 全サンプルの95%以上、または25%以上のサンプルで両遺伝子が関与する頻度過剰融合の除外、(5) TCGA正常647サンプルおよびGTEx (Genotype-Tissue Expression) 1,750正常サンプルで5例以上に認められる融合の除外。これにより、ライブラリ構築やアライメントアーチファクトに起因する偽陽性を大幅に削減した。

マニュアルレビュー基準: 上記のフィルタリングを通過した再発性キナーゼ融合候補 (n≥2) は、Integrative Genomics Viewer Robinson et al. NatBiotechnol 2011を用いて手動でレビューされた。機能的キナーゼ融合のドライバー候補を特定するために、以下の3つの要件を設定した。(a) 2つのエクソン間の遺伝子間ジャンクションの存在、(b) 予測されるin-frameコーディング配列、(c) 完全なキナーゼ触媒ドメインの保存。偽陽性は、相同配列や反復配列によるアライメントアーチファクト、または特定のサンプルにおける一方または両方の融合パートナーの非常に高い発現 (トランススプライシングによる非特異的RNAキメラの産生) に基づいて除外された。

機能的アノテーションと統計解析: 再発性候補融合タンパク質配列は、Pfamデータベースを用いて構造ドメインについて検索された。コイルドコイル (CC) ドメインの存在はLupasらの方法で確認され、その他の二量体化または多量体化ドメインはInterProを用いてパートナータンパク質配列内で確認された。RNA-seq発現定量は、Cufflinks v2.1.1を用いてGencode v17データベースのすべてのCCDS (Consensus Coding Sequence) トランスクリプトについて、FPKM (fragments per kilobase of mRNA per million mapped reads) で定量された。コピー数データは、GDAC (Genome Data Analysis Center) ポータルから2014年4月16日リリース版がダウンロードされた。融合陽性サンプルと陰性サンプル間の遺伝子発現比較には、Mann-Whitney U検定が用いられた。また、本研究のパイプライン検証および発現解析の参照用コントロールとして、MCF-7 (human breast cancer cell line) および HEK293T (human embryonic kidney cell line) 由来のRNA-seqデータセットも一部解析プロセスにおいて参照された。