- 著者: Xu JY, Zhang C, Wang X, Zhai L, Ma Y, Mao Y, et al.
- Corresponding author: Tan M (Shanghai Institute of Materia Medica, CAS [Chinese Academy of Sciences]); Xiao T (Cancer Hospital, CAMS [Chinese Academy of Medical Sciences]/PUMC [Peking Union Medical College]); He F (Beijing Institute of Lifeomics); Li J (Shanghai Jiao Tong University); Wang Y (National Center for Protein Sciences, Beijing)
- 雑誌: Cell
- 発行年: 2020
- Epub日: 2020-07-09
- Article種別: Resource (Original Article)
- PMID: 32649877
背景
肺癌は世界最高の罹患率と死亡率を示す悪性腫瘍であり、5年生存率は20%未満にとどまる (Bray et al. CACancerJClin 2018)。肺腺癌 (LUAD) はNSCLC (非小細胞肺癌) の最多組織型であり、全肺悪性腫瘍の約40%を占める。TCGAコンソーシアムをはじめとする大規模ゲノム研究 (Collisson et al. Nature 2014) はTP53・KRAS・KEAP1・STK11・EGFRなどのドライバー遺伝子を同定し、EGFR阻害薬・ALK阻害薬・免疫チェックポイント阻害薬などの精密治療の基盤を築いてきた。中国およびアジア諸国では女性非喫煙者のEGFR変異型LUADが全体の40-50%を占め、欧米人コホートとは変異景観が大きく異なることが報告されている (Chen et al. NatGenet 2020)。
しかしこれらのゲノム研究の大半は欧米人を対象としており、中国人LUADに固有のプロテオーム特徴およびリン酸化シグナル伝達ネットワークの全体像は手薄であった。mRNA発現と蛋白発現の相関は中程度にとどまることが知られており、スプライシング・翻訳後修飾・蛋白分解などにより両者が解離するため、ゲノム・転写情報だけでは機能的な分子機構の理解には gap in knowledge が存在する。このため、中国人LUADを対象としたプロテオームレベルでのサブタイプ分類・予後バイオマーカーの同定・薬物標的の探索が強く求められていた。
目的
2010年3月から2016年5月に中国3施設 (国立がん病院CAMS [Chinese Academy of Medical Sciences]/PUMC [Peking Union Medical College]・宣武病院・天津保定病院) で収集した治療未施行中国人LUAD患者103例を対象として、(1) プロテオーム・リン酸化プロテオーム・WES (全エクソームシーケンシング)・RNA-seqの4層統合マルチオミクス解析により分子的特徴と臨床転帰の連関を明らかにすること、(2) プロテオームに基づくLUADサブタイプを同定しEGFR/TP53変異との関連を解析すること、(3) HSP90βを含む予後バイオマーカー候補を同定・独立コホートで検証すること、(4) LUAD治療の新規薬物標的を探索することを目的とした。
結果
マルチオミクス統合景観とゲノム特徴: 103例のLUADにおいてLC-MS/MSで計11,119蛋白群を1% FDRで同定し、腫瘍11,091群・NAT10,793群がそれぞれ検出された。腫瘍での平均定量蛋白数は6,682群/サンプル (最小4,266・最大8,655) であった (Fig 1C)。リン酸化プロテオームでは79ペアから22,564リン酸化サイト (5,277リン酸化蛋白) を同定した (Fig 1D)。WESで17,917の遺伝的変異イベントを検出し、EGFR変異50%・KRAS変異6%・TP53変異51%と、欧米TCGAコホート (EGFR 14%・KRAS 33%・TP53 46%) と明確に異なる中国人特有の変異景観が確認された (Fig 1B)。mRNA-蛋白発現相関はRNA-seq/プロテオームペア (n=51) で腫瘍Pearson r=0.28・NATでr=0.07と中程度であり、スプライシングおよびリボソーム経路で負の相関が観察された。RNA-seqとプロテオームの双方で予後関連を示した遺伝子は52遺伝子にとどまり、全体の94.6%の遺伝子はどちらか一方のデータセットでのみ予後情報を持ち、2層のデータが相補的予後情報を提供することが示された (Fig S2E)。
CNA多層制御と変異タンパク質バリアント: 23,080 CNAのうちmRNA発現に影響したのは17,179件 (74.4%)、蛋白発現に影響したのは10,530件 (45.6%)、リン酸化蛋白への影響は4,330件 (18.8%) であった (Spearman相関、FDR<0.05; Fig 2A)。EGFRはcis・trans両方の制御に最大の影響を持つ唯一のドライバー遺伝子として同定され、蛋白・リン酸化蛋白の双方に対するcis効果を示した。13,845非同義SNVおよび1,365インデルのうち、プロテオームレベルで検証された変異は166件 (1.2%・171変異ペプチド) にとどまり、うち120件はCOSMICデータベース未収載の新規変異であった (Fig 2B; Table S6)。さらに新規スプライシングイベントの0.32% (1,366/428,320件) および融合転写産物の1.59% (3/189件) が質量分析で確認された (Fig 2C)。
腫瘍-NAT間プロテオーム差異と早期LUAD予後特徴: 主成分分析 (PCA) で腫瘍とNATのプロテオームは明確に分離し (Fig 3A)、3,355蛋白が差次発現を示した (n=103ペア解析、BH法 [Benjamini-Hochberg method] p<0.05、T/N>2またはT/N<0.5)。腫瘍富化経路はプロテアソーム・解糖・リボソーム・ユビキチン化・DNA修復・細胞周期を含み、NAT富化経路はECM (細胞外マトリックス) 受容体相互作用・密着結合・ABCトランスポーターを含んだ。7種の肺特異的署名蛋白 (AGER・SFTPA2・CACNA2D2・LAMP3・SCGB1A1・SFTPB・SFTPC) は腫瘍で発現消失し、AGER・SFTPA2・CACNA2D2は予後と有意相関した (log rank p<0.05; Fig 3D)。TNM stage I患者の予後良好群 (DFS [無病生存] >3年、n=36) vs 予後不良群 (DFS<3年、n=15) 比較では、不良予後群でEMT (上皮間葉転換)・TNFα・mTOR・MYCシグナルが富化し (FDR<0.05、NES=-2.0~-2.1)、良好予後群では脂肪酸代謝・酸化的リン酸化が富化した (NES [normalized enrichment score]=1.5~2.9; Fig 4A)。代謝関連蛋白MAOA・ACSS1・ANK1は良好予後群で高発現 (Wilcoxon p<0.05、fold change>2)、EMT関連THBS1・PLOD2は不良予後群で高発現し予後と逆相関した (Fig 4B)。
3プロテオームサブタイプの同定と分子・臨床的特徴: 上位25%変動蛋白1,567個を用いたコンセンサスクラスタリングにより3サブタイプを同定した。S-I (EM-H型・環境/代謝優位型、n=21) は脂肪酸代謝・ECM受容体相互作用・アミノ酸代謝経路が富化し、全生存 (OS)・DFSとも最良の転帰を示した (log rank p<0.05; Fig 5B)。早期病期 (Fisher p=0.006)・lepidic病理型 (p=0.006) がS-Iに濃縮し、肺署名蛋白を高発現した。S-III (PP型・増殖/プロテアソーム型、n=34) はリボソーム・プロテアソーム・DNA複製・蛋白分解経路が富化し、最悪の臨床転帰を示した (p<0.05)。S-IIIでは低分化度 (p=0.0001)・固形型病理 (p=0.0002)・高TNM病期 (p=0.006) が多く、組織学的マーカーTTF-1 (p=0.003) とNAPSA (p<0.0001) の発現が最低で、TMB (腫瘍変異量) が最高 (Kruskal-Wallis p=0.049) であった。MHCクラスII蛋白 (HLA-DR等) の癌細胞発現がS-IIIで最低であり (Fisher p=0.0035)、770種の免疫関連蛋白を評価した解析で136蛋白がサブタイプ間で差次発現を示した (BH p<0.05; Fig 5G; Table S4)。S-II (n=48) はEGFR変異頻度が最高 (p=0.011) で中間的特徴を呈した。リン酸化プロテオームサブタイプ (n=79) と転写産物サブタイプ (n=51) との一致率はそれぞれ38.0%・41.2%にとどまり、オミクス層間の解離が明確に示された。
リン酸化プロテオームとサブタイプ特異的キナーゼ活性: 腫瘍においてNATと比較して474リン酸化蛋白が増加・183が減少した (BH p<0.01; Fig 6A)。最大増加リン酸化蛋白はHSP90AB1・GFPT1・CLIC6であった。KSEA解析でCSNK2A1・MAPKAPK2・CDK1/2・SGK1が腫瘍で活性化された。サブタイプ特異的活性化キナーゼとしてAKT1 (S-I)・PRKCE (S-II)・AURKB/PRKCA/MAPK14 (S-III) が同定された (Fig 6B)。97種の2倍以上増加リン酸化蛋白のうち48種が予後関連を示し (log rank p<0.05; Table S5)、CTNNB1・SPTBN1・SNTB1のリン酸化は3サブタイプ間で差次発現し予後とも相関した (Fig 6C)。CAV2 S23リン酸化 (T/N=2.6以上) とEIF2S2 S2リン酸化はOSと有意相関した (log rank p<0.05; Fig 6D)。
HSP90β予後バイオマーカーの同定・検証と薬物標的候補: 4基準 (全103例での発現・上位1,000蛋白・T/N≥4倍・高発現が予後不良) を満たした27蛋白のうちHSP90AB1 (HSP90β) が最重要候補として選定された (Table S7)。HSP90βは腫瘍でNATより高発現 (T/N=4.6、Wilcoxon p<0.05; Fig 7A)。2つのリン酸化部位 (pS226 T/N=2.6・pS255 T/N=4.9) が腫瘍で増加し予後と有意相関した (Fig S7E-F)。独立コホートELISA検証でLUAD患者705例 vs 健常者282例の血漿HSP90βを比較し腫瘍側で有意高値を確認 (Wilcoxon p<0.05; Fig 7B)。499例での予後解析ではHSP90β高発現が予後不良と関連した (log rank p<0.05; Fig 7C)。HSP90阻害薬タネスピマイシンの中央IC50値はLUAD細胞株225 nM・LUSC (肺扁平上皮癌) 細胞株154 nMで、SCLC (小細胞肺癌) 細胞株 (3 μM) より有意に低く、治療標的としての潜在性が裏付けられた (Fig 7D)。薬物可能性・予後・CERES (Cancer Dependency Map effect score、遺伝子依存性スコア≤-0.6)・T/N比の4基準から11の薬物標的候補 (CARS・MCM2・GAPDH・GMPS・CTPS1・TPI1・COASY・NUP107・IMPDH2・PCYT1A・DICER1) が選定され、IMPDH2とGADPHはFDA承認薬の標的であった (Fig 7E-F; Table S7)。EGFR変異LUAD解析からはさらに10候補 (PSMB2・MCM5・IARS・POLD1・CHD4・CTPS1・GMPS・RARS等) が追加同定された。
考察/結論
本研究は中国人LUAD特化の初の包括的4層マルチオミクスリソースであり、欧米人対象の先行TCGA研究 (Collisson et al. Nature 2014) と異なり、本研究はアジア人特有の変異景観 (EGFR優位50% vs TCGA 14%・KRAS稀少6% vs TCGA 33%) を蛋白機能レベルで初めて定量化した。既存のゲノム研究が主としてmRNAレベルの情報に依存していたのとは異なり、本研究はプロテオームとリン酸化プロテオームの統合解析により、mRNA-蛋白発現の解離 (Pearson r=0.28) という独立した機能情報層の重要性を定量的に示した。プロテオームに基づく3サブタイプ (S-I/S-II/S-III) の確立は本研究で初めて中国人LUADに適用された新規な分子分類法であり、転写産物サブタイプ (一致率41.2%) やリン酸化サブタイプ (38.0%) とは独立した予後予測能を持つ。
既存研究との相違として、欧米人コホートではTP53/EGFR共変異の独立予後効果が認められなかったことが報告されているが (Shepherd 2017)、本中国人コホートではEGFR・TP53共変異患者 (n=27) がEGFR単独変異患者より有意に予後不良を示しており、これまでの研究では明確でなかった人種依存的な予後影響が蛋白レベルで初めて実証された。S-IIIにおけるMHCクラスII低発現 (癌細胞でFisher p=0.0035) と高TMBの並存は、アレル特異的MHC喪失によるサブクローナル免疫逃避機序と整合し、S-IIIへの免疫療法適用の観点から新規な知見である。
最も直接的な臨床応用として、HSP90βの血漿バイオマーカーとしての大規模検証 (n=705) が挙げられる。血漿タンパク測定という臨床現場で実施可能な手法での予後予測は、複雑なゲノム検査を補完する実用的な分子診断ツールとなる臨床的意義を持つ。IMPDH2 (免疫抑制薬ミコフェノール酸の標的)・GAPDH (Warburg効果の鍵酵素・GAPDH阻害薬の治療標的候補)・PSMB2 (プロテアソーム阻害薬ボルテゾミブ等の標的) などFDA承認薬の適応拡大が期待できる候補が複数同定された点も、臨床的意義が大きい。3プロテオームサブタイプはS-III (高TMB・MHCクラスII低下) に対する免疫チェックポイント阻害薬の適応拡大を含む、サブタイプ特異的治療戦略開発の基盤となる可能性がある。
残された課題として、(1) 3プロテオームサブタイプの多施設・多民族外部コホートでの独立検証、(2) AURKB・AKT1等のサブタイプ特異的キナーゼ阻害薬の前臨床・臨床有効性評価、(3) EGFR変異型LUAD特異的薬物標的10候補の治療応用展開、(4) 変異タンパク質バリアント29種の標的可能性の詳細評価、(5) mRNA-蛋白発現解離の分子機構解明が今後の検討として挙げられる。また本研究は103例という比較的小規模コホートに限定されており (limitation)、データ取得時点の技術的制約もある。本研究の4層マルチオミクスリソースは中国人LUADにおける精密医療推進の包括的分子基盤を提供し、future research に向けた重要な出発点となる。
方法
プロテオームおよびリン酸化プロテオーム解析: 治療未施行中国人LUAD患者103例の腫瘍・NAT (non-adjacent tissue) ペアを対象に、CNHPP (Chinese Human Proteome Project) 基準のラベルフリー定量LC-MS/MS (液体クロマトグラフィー-タンデム質量分析法、Orbitrap Fusion、MaxQuant v1.6.5.0、タンパク質・ペプチドレベル各1% FDR、iBAQ [intensity-based absolute quantification] で定量) を全103ペアで実施した。リン酸化プロテオームの解析には、TiO2エンリッチメント法を用い79ペアで実施し、局在化確率≥75%のリン酸化サイトのみを採用した。
ゲノム・トランスクリプトーム解析: WES (whole-exome sequencing、Agilent SureSelect Human All Exon V6) を全103ペアで実施し、BWA-MEM/GATK 3.7/Mutect2パイプラインにより体細胞SNV (single-nucleotide variant)・インデル・CNA (copy number alteration、体細胞コピー数変異) を同定した。RNA-seq (51腫瘍・49 NAT、Illumina HiSeq 150 bp paired-end) はHISAT2 v2.0.4/StringTie v1.3.4dでアライメント・定量し、FPKM (Fragments Per Kilobase of transcript per Million mapped reads)>1を発現と定義し16,188遺伝子を抽出した。変異シグネチャ解析にはdeconstructSigs v1.8.0を用い30種のCOSMICシグネチャを解析した。
統計・バイオインフォマティクス解析: 腫瘍-NAT間の差次発現はWilcoxon符号順位検定 (BH法補正、FDR<0.05) を用いT/N>2またはT/N<0.5で発現変動と定義した。プロテオームサブタイプ同定にはConsensusClusterPlus v1.48.0 (k-means法・Euclidean距離・n=1,000リサンプリング・サンプル80%部分抽出) を使用し、上位25%変動蛋白1,567個をインプットとした。経路解析にはGSEA (遺伝子セット富化解析、Hallmark/KEGG/GO遺伝子セット、FDR<0.05) を適用。予後解析はKaplan-Meier法・log-rank検定で実施。CNA-発現相関はSpearman相関係数で算出 (FDR<0.05)。リン酸化キナーゼ活性推定にはKSEA (Kinase Substrate Enrichment Analysis) を使用し、PhosphoSite・Phospho.ELM (Eukaryotic Linear Motif database)・PhosphoPOINTのキナーゼ-基質情報を参照した。共発現モジュールはWGCNA (Weighted Gene Co-expression Network Analysis) で同定した。
HSP90β検証コホート: 705例のLUAD患者と282例の健常者の血漿HSP90β濃度をELISA (USCN社キット) で測定し、499例で生存解析を実施した (中央追跡期間48ヶ月)。
薬物感受性解析: タネスピマイシン (17-AAG、HSP90阻害薬) のIC50データはCCLE (Cancer Cell Line Encyclopedia) データベースから取得した。解析対象にはLUAD細胞株 (A549・H1299・HCC827等)・LUSC細胞株・SCLC細胞株を含み、各がん種の中央IC50値を比較した。