- 著者: Qi Song, Ye Yang, Dongxian Jiang, Zhaoyu Qin, Chen Xu, Haixing Wang, Jie Huang, Lingli Chen, Rongkui Luo, Xiaolei Zhang, Yufeng Huang, Lei Xu, Zixiang Yu, Subei Tan, Minying Deng, Ruqun Xue, Jingbo Qie, Kai Li, Yanan Yin, Xuetong Yue, Xiaogang Sun, Jieakesu Su, Fuchu He, Chen Ding, Yingyong Hou
- Corresponding author: Fuchu He (State Key Laboratory of Proteomics, Beijing Institute of Lifeomics, Beijing, China); Chen Ding (School of Life Sciences, Fudan University, Shanghai, China); Yingyong Hou (Department of Pathology, Zhongshan Hospital, Fudan University, Shanghai, China)
- 雑誌: Nature communications
- 発行年: 2022
- Epub日: 2022-07-18
- Article種別: Original Article
- PMID: 35851595
背景
扁平上皮癌(SCC)と腺癌(AC)は固形がんにおける2大組織型であり、世界的に極めて高い罹患率と死亡率を示す主要な悪性腫瘍である。Bray et al. CACancerJClin 2018などの先行研究において、がん罹患率と死亡率の統計データが示され、これらの組織型の制御が公衆衛生上の重要課題であることが強調されてきた。ACにおいては、分子生物学的な発がんメカニズムの理解が進んだことで、標的治療や診断法の開発が大きく進展している。これに対し、SCCは皮膚、肺、食道、気道、泌尿生殖器など多様な臓器の層状扁平上皮から発生し、組織学的に類似した形態を示すため、転移巣における原発臓器の同定や起源診断が極めて困難であるという課題が存在する。
さらに、膵臓、甲状腺、乳房、肛門などの非定型組織から発生する「稀なSCC(化生性SCC)」は、一般的なSCCと比較して転移性が高く、極めて悪性度が高い臨床経過をたどることが知られているが、その生物学的特性は依然として未解明である。汎SCC診断マーカーとして推奨されるTP63(tumor protein p63)は、リンパ腫など他の腫瘍型でも陽性を示すことがあり、特異性の低さが臨床上の課題となっている。
これまでに、The Cancer Genome Atlas(TCGA)プロジェクトなどのゲノム・トランスクリプトーム解析により、肺SCC(TCGA et al. Nature 2012)や肺AC(Cancer et al. Nature 2014)を含む主要ながん種の包括的な分子プロファイルが報告されてきた。これらの先行研究は、細胞周期、アポトーシス、受容体チロシンキナーゼ(RTK)シグナル伝達、扁平上皮分化、クロマチンリモデリングに関連する遺伝子変異を同定した。しかし、ゲノムやトランスクリプトームの情報はタンパク質の機能的状態や翻訳後修飾を直接反映するものではなく、治療標的として有用な機能的プロテオームの理解は不十分であった。また、Li et al. ClinCancerRes 2019はSCCの免疫サブタイプを報告しているが、大規模かつ複数臓器を網羅したプロテオミクスデータは含まれておらず、SCCとACの体系的な比較や、複数臓器にわたるSCCのプロテオームアトラスは圧倒的に不足していた。本研究は、この知識のギャップを埋めるために実施された。
目的
本研究の目的は、17臓器333例の原発性SCCおよび7臓器69例のACを含む大規模なプロテオームコホートを構築し、質量分析を用いた深部プロテオミクス解析を実施することである。具体的には、以下の点を解明することを目的とする。 (1) 複数臓器を横断したSCCとACの間における機能的プロテオームおよび代謝経路の差異と、それらが予後に与える影響の解明。 (2) 一般的なSCCと稀なSCC(化生性SCC)の間におけるプロテオーム特性の比較と、悪性度に関与する分子シグネチャーの同定。 (3) TME(tumor microenvironment; 腫瘍微小環境)における免疫細胞浸潤パターンに基づくSCCの新規サブタイプ分類の構築と、各サブタイプにおける治療標的候補の探索。 (4) HPV(human papillomavirus; ヒトパピローマウイルス)感染状況と関連するSCCの分子特性および免疫抑制機序の解明。 (5) 転移性SCCの起源臓器診断を高い精度で支援する、プロテオームシグネチャーに基づいた機械学習診断分類器の開発と検証。
結果
プロテオームデータの再現性とカバレッジ: 本研究で収集された333例のSCCサンプルから、高品質なプロテオームデータが取得された。HEK293T細胞(n=3 replicates)を用いた品質管理サンプル間の平均相関係数は0.90であり、反復サンプルの平均相関係数は0.92であった。全333サンプル間のSpearman相関係数の中央値は0.74であり、高い再現性が示された。合計14,840のタンパク質グループが定量され、1サンプルあたり平均8,120のタンパク質グループが同定された(範囲: 6,261〜9,296)。既知のSCC診断マーカーであるKRT5(333サンプルにおける変動係数CV=0.083)およびTP63(CV=0.069)は、すべてのSCCで均一に高発現していた。また、AKT1(CV=0.060)は全症例で遍在的に発現していた (Fig. 1d)。
SCCとACにおけるプロテオームの機能的差異: SCCとACの比較において、1,538のタンパク質が有意な差次発現を示した(Wilcoxon rank-sum test, BH-adjusted p<0.05, fold change>2.0)。このうち643タンパク質がACで、895タンパク質がSCCで濃縮されていた (Fig. 2b, c)。GSEA解析では、AC濃縮タンパク質はリボソーム、液性免疫応答、細胞外マトリックス(ECM)経路に有意に濃縮されていた。一方、SCC濃縮タンパク質は、ケラチン化、p53下流経路、および抗ウイルス応答に関連する経路に主に濃縮されていた (Fig. 2d)。
ECMおよび糖代謝関連因子の予後不良性: ACで濃縮されたECM(COL4A1, FN1, PKMなど)およびグルコース代謝(SDHA, LDHA, ENO1など)関連タンパク質は、SCCおよびACの両コホートにおいて、9つのTCGAデータセットを含め、一貫して不良な予後と相関した(BH-adjusted p<0.05)(Fig. 2e)。特に、肺ACと膵臓ACでこれらのタンパク質の予後影響が顕著であった。
ケラチン化関連因子の予後方向の逆転: SCCで濃縮されたケラチン化関連タンパク質(KRT13, DSC3, PKP1など)は、SCCコホートでは良好な予後と関連したが(p=0.0135)、ACコホートでは不良な予後と逆相関を示した (Fig. 2e)。この逆相関は9つのTCGAデータセットでも再現された。
稀なSCCにおける脂質代謝と転写因子の亢進: 稀なSCCは一般的SCCと比較して、脂質代謝関連タンパク質(PLIN1, ACSS3, FBN1など)が有意に濃縮されていた (Fig. 3c, d)。低分化・低ケラチン化SCCではRNAプロセシングおよびミトコンドリア経路が濃縮されていた。転写因子であるRUNX2とFOXO1は稀なSCCで過剰発現しており、脂質代謝を制御する重要な役割を果たすことが示唆された (Fig. 3g, h)。PLIN1は稀なSCCで高発現しており、3例の肛門SCCでPLIN1遺伝子増幅(PLIN1/nucleus ratio = 6.2)が検出された (Fig. 3e, f)。
プロテオミクスに基づく4つのSCCサブタイプ: 333例のSCCサンプルを対象とした階層的クラスタリングにより、4つのプロテオミクスサブタイプが同定された (Fig. 4b)。クラスター1(食道、皮膚、口腔、咽喉)は細胞骨格機能と免疫に関連し、クラスター2(胸腺、肺、鼻咽頭)は好気性酸化とリン脂質代謝が特徴であった。クラスター3(乳房、甲状腺、膀胱、胆嚢、膵臓)は稀なSCCで構成され、ECM糖タンパック質、脂肪酸代謝、炎症応答経路が濃縮され、ACと類似した特徴を示し、4つのクラスターの中で最も不良な予後と関連した(Supplementary Fig. 8b, c)。クラスター4(陰茎、会陰、肛門、子宮頸部、膣)はアノゲニタルSCCで構成され、細胞周期チェックポイント、E2F標的、プログラム細胞死が濃縮され、最も良好な予後を示した。
免疫細胞浸潤に基づく6つのTMEサブタイプ: xCellを用いた解析により、6つのTMEサブタイプが同定された (Fig. 5a)。これらは古典的扁平上皮(ClSq)、脂肪酸代謝(FaSq)、好塩基球炎症(BaSq)、好中球炎症(NeSq)、好酸球炎症(EoSq)、免疫ホット(IhSq)と命名された。各サブタイプは独自のTMEシグネチャとシグナル伝達経路を特徴とし、特定の治療標的候補が同定された (Fig. 5b, e)。例えば、FaSqサブタイプでは脂肪酸代謝関連経路が亢進しており、PDE3B(phosphodiesterase 3B)が治療標的候補として挙げられた。
HPV関連SCCの分子特性と免疫抑制: アノゲニタルSCCにおいてHPV感染率が評価された。HPV16はアノゲニタルSCC患者の主要なタイプであり、感染率は54%を超えた (Fig. 6b)。HPV16陽性SCCでは、イノシトールリン酸異化プロセスと宿主によるウイルス転写の正の制御が亢進しており、抗原受容体媒介シグナル伝達経路およびT細胞受容体シグナル伝達経路の負の制御が認められ、免疫抑制が示唆された (Fig. 6d, e)。
19タンパク質による診断分類器の構築と検証: 19タンパク質からなる診断分類器は、SCCの発生臓器を高い精度で分類可能であった。トレーニングセット(n=249 patients)では感度・特異度ともに100%を達成し、検証セット(n=84 patients)でも同様に100%の感度・特異度を示した (Fig. 7b)。PRKCE、SLC27A1、CPXM2の単独診断価値をIHCで検証した結果、PRKCEは子宮頸部および膣SCCで高発現し、SLC27A1は胆嚢および膵臓SCCで高発現、CPXM2は胸腺SCCで高発現し、高い特異性を示した (Fig. 7d)。
考察/結論
本研究は、17臓器のSCCと7臓器のACを含む、これまでで最大規模のマルチ臓器がんプロテオームアトラスを構築した。この包括的なプロテオーム解析は、SCCの臨床的、生物学的、治療的理解に新たな洞察をもたらすものである。
先行研究との違い: ゲノム・トランスクリプトーム解析が先行研究で報告されてきたが、本研究はタンパク質レベルでの機能的プロテオームの差異を明らかにした点で、これまでの研究と異なり、治療標的として有用な機能的プロテオームの理解を深めた。特に、ECMおよび糖代謝関連タンパク質が組織型を超えて一貫して不良な予後因子であること、およびケラチン化関連タンパク質がSCCとACで予後方向を逆転させるという発見は、治療標的選択において組織型特異的な解釈が必須であることを示唆する。
新規性: 本研究で初めて、稀なSCCにおいて脂質代謝の亢進が認められ、RUNX2とFOXO1がその重要な転写制御因子として同定されたことは新規な発見である。これは、解剖学的起源が異なる転移性SCCの診断における新規マーカーとなる可能性を示す。また、プロテオミクスに基づく階層的クラスタリングにより4つのSCCサブタイプが特定され、解剖学的特徴と異なる開始メカニズムが示唆されたこともこれまで報告されていない知見である。さらに、免疫細胞浸潤に基づく6つのTMEサブタイプを同定し、各サブタイプに特異的な治療標的候補を提示したことは、個別化医療への道を開く新規なアプローチである。
臨床応用: 本プロテオームアトラスは、SCCとACの新規治療標的探索、転移巣の起源臓器診断の精度向上、および分子分類の精緻化に貢献する臨床的意義を持つ。kinase-TFネットワークによるシグナル経路の可視化は、プロテオタイプ特異的な治療介入の根拠となる。また、PRKCE、SLC27A1、CPXM2を含む19タンパク質からなる診断分類器は、腫瘍の起源を高い精度で予測し、臨床現場での診断支援ツールとしての臨床応用が期待される。
残された課題: 本研究のlimitationとして、特定の腫瘍型におけるサンプルサイズの相対的な小ささが挙げられる。また、生存解析は主にRNA-seqデータセットを用いて行われたため、これらのタンパク質の予後価値を検証するには、さらなるプロテオミクス研究が今後の検討課題である。さらに、診断マーカーの検証は3つのタンパク質に限定されており、他のマーカーについては特異的抗体の入手が残された課題である。最も重要な残された課題は、これらのマーカーが転移性SCCの起源を特定する上でどのように機能するかは不明である点であり、転移性SCCを含む大規模な検証解析が緊急に必要とされる。
方法
本研究では、中山病院(復旦大学)において術前未治療の原発腫瘍切除術を受けた患者から収集されたサンプルを用いた。SCCコホートは17臓器333例で構成され、一般的SCCおよび稀なSCCが含まれる。比較対象として、7臓器69例のACを解析した。腫瘍細胞純度80%以上の領域を組織スライドから回収し、タンパク質を抽出した。
プロテオミクス解析には、LFQ(label-free quantification; ラベルフリー定量)技術を導入した高速液体クロマトグラフィー質量分析(LC-MS/MS、timsTOF Pro)を採用した。ペプチドおよびタンパク質レベルでFDR(false discovery rate; 偽陽性率)を1%未満に制御し、14,840個のタンパク質グループを定量した。データはlog2変換され、TIC(total ion current; 全イオン電流)正規化を行い、欠損値は最小値の1/10で補完した。バッチ効果はComBatアルゴリズムを用いて除去した。
組織マイクロアレイ(TMA)を用いた免疫組織化学(IHC)により、主要なタンパク質の発現を検証した。また、Yoshihara et al. NatCommun 2013が開発したESTIMATE法を用いて免疫スコアおよび間質スコアを算出した。遺伝子セット濃縮解析(GSEA)およびssGSEA(single-sample GSEA)は、Hanzelmann et al. BMCBioinformatics 2013のGSVAパッケージを用いて実施した。キナーゼ-転写因子(TF)ネットワークはGENEMINIAを用いて再構築した。TMEサブタイプ分類は、xCellを用いて64種類の微小環境細胞タイプの遺伝子シグネチャを推定し、Wilkerson et al. Bioinformatics 2010のConsensusClusterPlusを用いて階層的クラスタリングを行った。
統計解析には、Wilcoxon rank-sum test、Kruskal-Wallis test、Fisher’s exact test、Spearman correlation(Spearman相関分析)、およびKaplan-Meier生存曲線とログランク(log-rank)検定、多変量コックス比例ハザード(Cox regression)モデルを用いた。品質管理(QC)用の標準サンプルとして、ヒト胚性腎細胞株であるHEK293T(human embryonic kidney 293T)細胞株(n=3 replicates)から調製したタンパク質溶解物を用いた。