• 著者: Anthony R. Soltis, Nicholas W. Bateman, Jianfang Liu, Trinh Nguyen, Teri J. Franks, Xijun Zhang, Clifton L. Dalgard, Coralie Viollet, Stella Somiari, Chunhua Yan, Karen Zeman, William J. Skinner, Jerry S.H. Lee, Harvey B. Pollard, Clesson Turner, Emanuel F. Petricoin, Daoud Meerzaman, Thomas P. Conrads, Hai Hu, Craig D. Shriver, Christopher A. Moskaluk, Robert F. Browning Jr., Matthew D. Wilkerson
  • Corresponding author: Craig D. Shriver (Uniformed Services University of the Health Sciences), Christopher A. Moskaluk (University of Virginia), Robert F. Browning Jr. (Walter Reed National Military Medical Center), Matthew D. Wilkerson (Uniformed Services University of the Health Sciences)
  • 雑誌: Cell Reports Medicine
  • 発行年: 2022
  • Epub日: 2022-11-15
  • Article種別: Original Article
  • PMID: 36384096

背景

LUAD (lung adenocarcinoma、肺腺癌) は米国のがん死亡原因の首位を占め、EGFR・ALK などを標的とした分子標的薬や免疫チェックポイント阻害剤の進歩にもかかわらず、腫瘍内・腫瘍間の広範な分子不均一性が個別化診断と治療の大きな障壁となっている。これまでの大規模ゲノム解析によりドライバー遺伝子変異・コピー数変化・融合遺伝子が網羅的に記述され (Imielinski et al. Cell 2012)、さらに TRU (terminal respiratory unit)・PP (proximal proliferative)・PI (proximal inflammatory) という RNA 発現サブタイプが TCGA (The Cancer Genome Atlas) によって同定され、それぞれ異なる臨床転帰・治療反応・変異プロファイルと関連することが示された (Cancer et al. Nature 2014)。しかし個別患者の転帰予測は依然として困難であり、標的療法が適応となる分子異常を持たない LUAD も多い。

翻訳・翻訳後レベルのプロテオーム情報を統合したプロテオゲノミクス (proteogenomics) 解析は、ゲノム単独では観察できない腫瘍生物学の層を解明する手段として台頭してきた。NCI の CPTAC (Clinical Proteomic Tumor Analysis Consortium) による LUAD プロテオゲノミクス研究 (Gillette et al. Cell 2020) は変異遺伝子に関連するプロテオーム変化とシグナル伝達ネットワークを明らかにしたが、複数の先行研究で RNA 発現とタンパク質発現の遺伝子ごとの相関幅 (r=0.14-0.53) に大きな乖離があり、バルク LUAD 腫瘍における RNA-タンパク質の関係については知識の空白 (gap in knowledge) が残る。さらに、既存のプロテオゲノミクスコホートは米国外の症例・非喫煙者・EGFR 変異例に偏っており、米国人集団の疾患スペクトラムを十分に代表していなかった。加えて臨床追跡データが手薄であり、RNA に比してタンパク質レベルの独立検証済み予後マーカーは著しく不足していた。米国人集団における喫煙歴別の発がん経路の多様性と、それに対応するプロテオゲノミクスの全体像を捉える大規模研究が求められていた。

目的

本研究は、APOLLO (Applied Proteogenomic OrganizationaL Learning and Outcomes) 研究ネットワークが実施したもので、タバコ使用で選択されていない米国人 LUAD 患者 87 例を対象に 6 層オミクス解析を統合し、(1) 喫煙病因と連動する新規分子サブタイプの同定、(2) 腫瘍純度・免疫微小環境が RNA-タンパク質発現相関に与える影響の定量と独立コホートでの検証、(3) RNA・タンパク質それぞれの生存予測シグネチャーの構築と独立検証、(4) サブタイプ特異的キナーゼ・転写因子ネットワークを介した治療標的候補の同定、を達成することを目的とした。

結果

体細胞ゲノムシグネチャーが定義する 3 つの LUAD 分子サブタイプ: n=87 の全ゲノム解析で腫瘍変異負荷 TMB (tumor mutational burden) と SV の広い分布が認められた (TMB 0.35-176 変異/Mb; SV 14-245 件)。多モーダル変異シグネチャー解析により 3 SNV・3 indel・4 SV シグネチャーが同定され、腫瘍は 3 サブタイプに分類された (Fig 1A)。Transition-high 型は C>T 転換 (加齢・APOBEC シグネチャー) が優位で非喫煙者に多く、TMB 中央値は最低 (2.3 変異/Mb)、EGFR 変異および腺房型組織型が濃縮された (Fisher’s exact p<0.05)。Transversion-high 型は G>T 転換 (喫煙発がん物質シグネチャー) が優位で現喫煙者に多く、TMB 中央値 20.7 と最高、KRAS・STK11 変異が濃縮された。Structurally altered (構造変異) 型は元喫煙者に多く、TMB 中央値 14.7、MMRD1 (mismatch repair deficiency 1) indel シグネチャーと中長鎖逆位シグネチャーで定義され、TP53 変異が最多 (p<0.05)、構造欠失・逆位も最多であった (Fig 1C, 1D)。構造変異型では DNA 損傷応答マーカーである TP53 Ser15 (serine 15) リン酸化レベルが他サブタイプより有意に高く (Wilcoxon p<0.0025; Fig 1F)、変異 TP53 pan-cancer RNA シグネチャースコアも最大を示し (Fig 1G)、TP53 変異による DNA 修復チェックポイント抑制が構造異常の蓄積を招く発がん経路が示唆された。3 サブタイプはタバコ曝露から腫瘍形成に至る異なる分子経路を反映しており、前喫煙者の構造変異型は既存の分類体系には存在しない独立した病因群を形成した。

腫瘍純度・免疫微小環境と RNA-タンパク質発現相関の定量的関連: 7,472 共検出遺伝子における遺伝子ごとの RNA-タンパク質発現相関の中央値は r=0.47 で、84% の遺伝子に有意な正の相関が認められた (Fig 2A)。独立した CPTAC コホートとの間でこの遺伝子ごとの相関値は強く一致し (Spearman r=0.73, n=87 vs 106, p<3e-16; Fig 2B)、高相関遺伝子は細胞接着・RAS シグナルに富み、低相関遺伝子は翻訳開始・酸化的リン酸化に富んだ (Fig 2C)。腫瘍ごとの RNA-タンパク質相関は APOLLO コホートで r=0.23-0.69 と広い分布を示した。腫瘍純度 (WGS 由来推定) との間に有意な正の相関 (Spearman r=0.51, n=87, p<8e-7)、組織学的腫瘍細胞性とも正相関 (r=0.37, n=87, p<4e-4) が認められた (Fig 2D)。一方、免疫細胞・間質細胞の RNA スコアとは負の相関 (それぞれ r=-0.54, r=-0.50, 各 p<2e-6)、タンパク質スコアとも負の相関 (r=-0.50, r=-0.52, 各 p<2e-6) を示した。これらの知見は CPTAC コホート (n=106) で独立検証され、腫瘍純度 (Spearman r=0.29, p<0.0027)・免疫 RNA スコア (r=-0.26, p<0.01)・間質スコア (r=-0.32, p<0.01) との関連が再現された。免疫細胞が豊富な LUAD では翻訳後制御の多様性が高まり RNA-タンパク質相関が低下することが、2 独立コホートで確立された。

タンパク質・RNA 発現シグネチャーによる患者生存予測と独立コホート検証: 共測定遺伝子を対象に無転移生存期間 MFS (metastasis-free survival) との関連を解析し、「生存タンパク質」560 個・「生存 RNA」155 個を同定した (Wald 検定, FDR<0.25)。RNA-タンパク質の対応するログハザード比間には有意な正の相関があり (Spearman r=0.48, n=87, p<3e-16; Fig 3A)、RNA とタンパク質を共に生存と関連する遺伝子群が最高の RNA-タンパク質相関を示した (Kruskal-Wallis p<7e-13; Fig 3C)。これらの生存シグネチャーは OS (overall survival) と MFS の両方で患者を強力に識別し (OS: タンパク質シグネチャー p<1.8e-5, RNA シグネチャー p<5.9e-5; MFS: タンパク質 p<2.9e-10, RNA p<8.5e-9; Fig 3B)、腫瘍ステージ・組織型・性別・補助療法を共変量として調整した後も有意性を保持した (Wald 検定, p<0.05)。CPTAC 独立コホートでの検証でも、タンパク質生存シグネチャーが OS と有意に関連 (p<0.033)、RNA 生存シグネチャーが OS (p<0.0078) および MFS (p<0.0043) と有意に関連した (Fig 3D)。共発現遺伝子の中では生存タンパク質 (560 個) が生存 RNA (155 個) を大幅に上回り、タンパク質レベルの発現情報が RNA より患者転帰と関連する頻度が高いことが定量的に示された。

発現サブタイプ特異的キナーゼネットワークと治療脆弱性の同定: RNA 発現サブタイプ (TRU/PI/PP) はタンパク質発現での分類と高い一致を示した (Fisher’s exact p<8e-19)。各サブタイプは特徴的な TMB・免疫含有量を示し、TMB は PI サブタイプで最高 (中央値 PI 27.8 vs PP 13.3 vs TRU 3.2 変異/Mb、Kruskal-Wallis p<6e-6; Fig 4A)、高 TMB 割合 (>10 変異/Mb) は PI 78% / PP 67% / TRU 23% と有意に異なった (Fisher’s exact p<5e-5)。PI サブタイプのリン酸化プロテオミクスネットワークは IFNγ (interferon gamma) シグナル主導型を示し、PRKCD (protein kinase C delta) が STAT1 S727 をリン酸化して転写活性を促進し、HLA タンパク質や CIITA (class II MHC transactivator) RNA の上昇と一致した (Fig 5B)。PD-L1 タンパク質は PI において有意に過剰発現し、E1L3N・CAL10 (anti-PD-L1 antibody clone)・SP-142 の 3 種の検証済み抗体クローン全てで確認された (Fig 6)。高 TMB・高 PD-L1・CTLA4 RNA 上昇から、PI は免疫チェックポイント阻害剤 (immune checkpoint inhibitor) の最も有望な治療対象と考えられる。TRU サブタイプは EGFR 変異濃縮 (p<0.05) と EGFR 下流の ERK・PI3K-PDK1・RPS6KA1 (ribosomal protein S6 kinase A1) キナーゼ活性亢進が特徴であり、PRKCE (protein kinase C epsilon) の抗アポトーシス活性も亢進していた (Fig 5C)。PP サブタイプは「免疫冷 (immune-cold)」微小環境と CDK1/2/4 (cyclin-dependent kinase) 活性の顕著な亢進が特徴で、RB1 Ser780 リン酸化による E2F 転写因子の活性化が確認された (Fig 5D)。PP 腫瘍の 26/30 例 (87%) に STK11 および/または KEAP1 変異を認め、SMARCA4 変異も有意に濃縮した。STK11/KEAP1 共変異はメタボリックリプログラミングを誘発し、解糖系・グルタミン分解関連タンパク質の上昇が認められた。発現サブタイプおよび組織型は MFS と有意に関連したが、ゲノムシグネチャーサブタイプは OS・MFS のいずれとも有意に関連しなかった (Fig 4C)。

考察/結論

本研究はタバコ使用で選択されていない米国人集団の LUAD 87 例に対し 6 層プロテオゲノミクス解析を実施し、サブタイプ同定から治療脆弱性の解明まで多角的な知見を提供した。

既報と異なる点として、同じく CPTAC LUAD コホートを扱った Gillette らの研究と比較して、本 APOLLO 研究は中央追跡期間 50 ヶ月と大幅に長い縦断的臨床データを有し、より強力な生存解析を可能にした。これまでの研究では喫煙・非喫煙者の分子病因を統合的に把握したプロテオゲノミクスコホートが乏しく、本研究は米国の標準治療・環境曝露を背景とした LUAD の全体像を初めて提示したという点で既存コホートとは性格が異なる。先行研究で報告されていた EGFR 濃縮型 (transition-high) および KRAS/STK11 濃縮型 (transversion-high) に加え、元喫煙者・TP53 変異・ゲノム全体にわたる構造異常を三位一体とする「構造変異型」が新規に同定された点は、LUAD の発がん経路多様性に関する既報の枠組みを拡張する重要な発見である。

本研究で初めて確立された新規知見として、遺伝子ごとの RNA-タンパク質発現相関が 2 つの独立コホート間で高い一貫性を示すこと (r=0.73)、腫瘍ごとの RNA-タンパク質相関が免疫細胞含有量と負の相関を示すことの独立検証、そして共測定遺伝子において生存タンパク質 (n=560) が生存 RNA (n=155) を大幅に上回ることが挙げられる。特に後者は、タンパク質レベルの情報が RNA よりも臨床予後を反映している可能性を示唆する新規の知見であり、翻訳後レベルのバイオマーカー開発に重要な根拠を提供する。

臨床的意義として、本研究が確立した生存タンパク質シグネチャーは独立 CPTAC コホートで OS 予測が検証されており (p<0.033)、臨床応用可能な予後バイオマーカーとしての道筋が示された。また、タンパク質マーカーは FFPE (formalin-fixed, paraffin-embedded) 小生検でも測定可能なことが指摘されており、臨床現場での実装可能性が高い。サブタイプ別の治療標的として PI の免疫チェックポイント阻害剤、TRU の EGFR/RPS6KA1/PRKCE 阻害剤、PP の CDK4/6 阻害剤・グルタミナーゼ阻害剤・SCD (stearoyl-CoA desaturase) 阻害剤など、bench-to-bedside を促進する具体的な候補が示されており、精密医療の実現に向けた橋渡し研究の基盤となる。特に PP サブタイプでは SMARCA4 変異が CDK4 と合成致死 (synthetic lethal) 性を持つことが知られており、CDK4/6 阻害剤の選択的感受性が期待される。

残された課題として、本研究では腫瘍隣接正常肺組織の測定が行われておらず、腫瘍特異的発現変化のより詳細な特徴づけには正常対照データの統合が必要である。補助療法・新補助療法の治療反応データが限られており、同定された治療脆弱性の実際の臨床反応性を検証するための前向き無作為化試験が今後の重要な研究方向性 (future research) となる。特に PI サブタイプに対する免疫チェックポイント阻害剤試験、PP サブタイプに対する CDK/代謝標的薬試験の設計が求められる。また、液体生検や小生検でのタンパク質シグネチャー実装に向けた更なる検討と、大規模コホートでの前向き検証も必要である。

方法

コホートおよびデータ取得: 米国 LCBRN (Lung Cancer Biospecimen Resource Network; dbGaP: phs003011.v1.p1) から個別同意・IRB (institutional review board) 承認を得て収集した外科切除 LUAD (n=87)。収集期間 2012-2018 年。患者背景は年齢 mean ± SD 66.3 ± 10.2 歳、女性 48.3%、Stage I 52.9% / II 27.6% / III 17.2%、現喫煙 23% / 元喫煙 59.8% / 非喫煙 17.2%、Grade 2 39.1% / Grade 3 60.9%、中央追跡期間 50 ヶ月 (Table 1)。独立検証コホートとして NCI CPTAC LUAD データセット (n=106、中央追跡 15.6 ヶ月) を利用した。

プロファイリングプラットフォーム: (1) 腫瘍・対応正常組織の全ゲノムシーケンス (WGS: whole-genome sequencing、腫瘍 116x / 正常 39x)、(2) RNA シーケンス (RNA-seq、14,374 転写産物)、(3) オービトラップ質量分析 (MS: mass spectrometry) ベースのグローバルプロテオミクス (7,614 タンパク質)、(4) MS リン酸化プロテオミクス (10,093 リン酸化サイト)、(5) 逆相プロテインアレイ (RPPA: reverse-phase protein array、307 抗体)。

解析手法: 体細胞変異シグネチャーは多モーダル相関トピックモデリング (MultiModalMuSig) により SNV (single nucleotide variant) のトリヌクレオチドコンテキスト・indel・SV (structural variant) を統合分類した。RNA 発現サブタイプ (TRU/PI/PP) は既報予測因子で分類。RNA-タンパク質相関は 7,472 共検出遺伝子で Spearman 相関を遺伝子ごと・腫瘍ごとに算出し、腫瘍純度は ESTIMATE スコアおよび DNA WGS 体細胞変異シグナルで推定した (Yoshihara et al. NatCommun 2013)。生存解析には Cox 比例ハザードモデル (Cox proportional hazards model) および log-rank 検定を用い、多重検定は FDR (false discovery rate) 補正を適用。キナーゼ活性は KSEA (kinase-substrate enrichment analysis)、転写因子 (TF: transcription factor) 活性は TCGA ATAC-seq クロマチンアクセシビリティデータとの照合で推定した。統計的手法として ANOVA (analysis of variance)・カイ二乗検定・Wilcoxon 順位和検定・Kruskal-Wallis 検定・Fisher’s exact 検定・Spearman 相関・Cox 比例ハザードモデルを使用した。