• 著者: Andrew J. Gentles, Aaron M. Newman, Chih Long Liu, Scott V. Bratman, Weiguo Feng, Dongkyoon Kim, Viswam S. Nair, Yue Xu, Amanda Khuong, Chuong D. Hoang, Maximilian Diehn, Robert B. West, Sylvia K. Plevritis, Ash A. Alizadeh
  • Corresponding author: Ash A. Alizadeh (Department of Medicine, Division of Oncology, Stanford Cancer Institute, Stanford University, Stanford, CA, USA)
  • 雑誌: Nature Medicine
  • 発行年: 2015
  • Epub日: 2015-07-20
  • Article種別: Original Article
  • PMID: 26193342

背景

腫瘍の分子プロファイルおよび腫瘍関連細胞の分子プロファイルは、患者の予後や治療応答を予測するバイオマーカーとして大きな期待が寄せられている。しかし、これまでの研究で得られたデータセットは断片的であり、体系的な解析が困難であった。患者コホートの異質性、多様な治療レジメン、そして異なる技術プラットフォームの使用が、単一研究の結果の再現性や臨床転用性を限定的なものにしてきた。例えば、腫瘍浸潤リンパ球 (TIL) のサブセットであるCD8+ T細胞やCD45RO+メモリーT細胞は予後良好と関連することが報告されている一方で、制御性T細胞やマクロファージは文脈依存的に予後を良好にも不良にも影響することが知られている。しかし、これらの多様な細胞種と複数のがん種を統合した系統的な解析はこれまで実施されておらず、腫瘍免疫微小環境の全体像を包括的に理解するための知識ギャップが残されていた。

先行研究では、遺伝子発現シグネチャが治療応答予測に有用であることが示されているが、その多くは単一のがん種や少数の細胞タイプに焦点を当てていた。例えば、Galon et al. Science 2006は結腸直腸癌における免疫細胞の予後予測能を報告したが、汎がん的な視点での解析は不足していた。また、Fridman et al. NatRevCancer 2012は腫瘍免疫コンテクストの臨床転帰への影響を概説したが、多様な白血球サブセットの定量的な汎がん解析は未解明なままであった。さらに、Hanahan et al. Cell 2011が提唱した「がんの特性」においても、免疫系の役割は強調されているものの、個々の免疫細胞サブセットの予後予測能を大規模に統合したデータは不足していた。このような背景から、大規模な患者コホートと多様ながん種を横断的に解析し、汎がん的な予後予測因子としての遺伝子および腫瘍浸潤免疫細胞の役割を包括的にマッピングする新たなリソースと解析フレームワークの構築が強く求められていた。特に、約18,000例のヒト腫瘍データを用いた大規模なメタ解析は、これまでの断片的な知見を統合し、より頑健な予後予測バイオマーカーを同定する上で不可欠であると考えられた。

目的

本研究の目的は、公開されている遺伝子発現データと全生存期間データを統合した大規模なメタ解析フレームワークであるPRECOG (PREdiction of Clinical Outcomes from Genomic profiles) リソースを構築することである。このリソースと、バルク腫瘍トランスクリプトームから白血球サブセットの相対的割合を推定する計算手法であるCIBERSORTを組み合わせることで、以下の3つの主要な目標を達成することを目指した。(1) 39種類のがん種にわたる約18,000例のヒト腫瘍データを用いて、汎がん的な予後予測遺伝子を同定すること。(2) CIBERSORTを用いて22種類の腫瘍関連白血球 (TAL) サブセットの組成を推定し、それらとがん患者の生存率との複雑な関連性を汎がん的にマッピングすること。(3) FOXM1制御ネットワークが主要な予後不良因子として機能すること、およびKLRB1 (CD161をコード) などの予後良好遺伝子の発現が腫瘍関連白血球の浸潤を反映することを示すことで、腫瘍免疫微小環境の全体像と予後との関連性を明らかにすること。最終的に、このリソースと解析ツールを公開し、将来のバイオマーカー発見と治療標的探索に貢献することを目指した。

結果

汎がん共通予後遺伝子の優勢: PRECOG (PREdiction of Clinical Outcomes from Genomic profiles) リソースを用いて、39種類のがん種にわたる約18,000例のヒト腫瘍の遺伝子発現と全生存期間データを解析した。その結果、予後関連遺伝子(|metaz|>3.09、名目上の片側P<0.001)の約3分の2が複数のがん種で共通して予後と関連しており、これは偶然の期待値よりも有意に高かった(Monte Carloシミュレーション100,000回反復、P<10⁻⁵)。AutoSOME教師なしクラスタリングを用いて166のデータセット全体を統合解析したところ、5つの主要なクラスタが同定された。これらには、細胞増殖・細胞周期関連遺伝子(予後不良)、免疫応答遺伝子(予後良好)、細胞接着/EMT、血管新生関連遺伝子が含まれていた。特に、細胞増殖・細胞周期関連クラスタは乳がんや肺腺がんを含む多くの固形腫瘍で予後不良と関連したが、結腸がんや急性骨髄性白血病(AML)では予後不良とはならなかった。この解析は、PRECOGに含まれるn=166のデータセット全体で行われた。

FOXM1とKLRB1がトップ汎がん予後遺伝子: クロスバリデーション解析により、約30種類の組織型を解析した時点で予後予測能が飽和することが示された(図2a)。トップ10の予後不良遺伝子は細胞周期・分裂関連遺伝子(FOXM1、MKI67など)で構成され、トップ10の予後良好遺伝子はリンパ球サブセットマーカーに富んでいた。原癌遺伝子FOXM1の発現は最も頻繁に予後不良と関連し、臨床で増殖マーカーとして用いられるMKI67を上回る性能を示した。一方、KLRB1(CD161をコードし、いくつかのT細胞サブセットやNK細胞の表面マーカー)の発現は最も頻繁に予後良好と関連した。FOXM1-KLRB1複合スコアは、単一遺伝子単独よりも優れた予後予測能を示し、癌腫、脳腫瘍、造血器腫瘍の全てで患者の生存層別化に有効であった(図2c)。この複合スコアは、訓練セット(n=8データセット)から得られたCox回帰係数の中央値(FOXM1×0.243 + KLRB1×-0.169)を用いて定義された。この結果は、TCGA RNA-seq検証セット(n=6,663腫瘍)でも頑健に再現された。

FOXM1制御ネットワークの予後不良中核: トップ100の予後不良遺伝子に対するタンパク質-タンパク質関連 (PPA) ネットワーク解析では、汎がん統合時に個別のがん解析よりも有意に高い連結性を示した(図2d)。ENCODE/ChEA/mSigDBデータとの統合により、FOXM1 ChIP-seq結合標的遺伝子が最も有意に濃縮されており(P<2.2×10⁻²²)、FOXM1が予後不良遺伝子の中心ハブであることが確認された。対照的に、予後良好遺伝子では個別がん解析と汎がん解析の間でPPAネットワークの連結性に差は認められなかった。これは、予後良好な関連の大部分を占める腫瘍関連白血球 (TAL) のトランスクリプトームの異質性が、集約されたPPA研究では十分に捉えられないためと考察された。

TAL予後関連性の汎がんマップ: CIBERSORTを用いて、25種類のがん種、n=5,782腫瘍における22種類のTALサブセットの予後関連性を解析した(図3c)。腫瘍内γδ T細胞と多形核細胞 (PMN) シグネチャが、それぞれ最も有意な予後良好および予後不良の汎がん集団として特定された。M2マクロファージは予後不良と関連し、抗CD3/CD28共刺激(活性化)CD45RO+メモリーヘルパーT細胞および抗炎症性M1マクロファージは予後良好と関連した。KLRB1発現はγδ T細胞およびCD8+ T細胞シグネチャと最も強く相関し、KLRB1の予後良好性の基盤が示唆された。CIBERSORTによるPMN細胞分画の推定値と既知の壊死組織含有量との間には関連がなく、腫瘍内PMN細胞が単に組織壊死の指標ではないことが示された。

形質細胞 (PC) と好中球の逆相反予後予測: 肺腺癌と乳癌というPRECOGで最も詳細にプロファイルされた2つのがん種において、形質細胞 (PC) シグネチャは予後良好と、PMN細胞シグネチャは予後不良と、それぞれ対照的な関係を示した(図3d)。全がん種にわたる解析では、PMN細胞とPCシグネチャの間に有意な逆相関が認められた(Pearson相関 R=-0.46, P=0.02)。PMN/PC比率は、多様な固形腫瘍において有意な予後指標となることが示された(図4b)。PCシグネチャは腫瘍隣接正常組織よりも腫瘍内で高かったことから、腫瘍浸潤PCの予後予測値は一般的な免疫学的健康の代理指標ではなく、抗原駆動性のクローン増殖と液性免疫応答の役割を支持する。

TMA検証での確認: 187例の肺腺癌組織マイクロアレイ (TMA) を用いて、MPO(PMN)、IGKC(PC)、CD20(成熟B細胞)の連続切片染色を定量した。CIBERSORTによる推定値とTMA実測値は強く相関した(R>0.9)。PMN/PC比率の中央値で患者を層別化すると、生存期間に有意な差が認められた(マイクロアレイデータ:ログランクP=0.0005, HR 1.5 (95% CI 1.2-1.9); TMAデータ:P=0.028, HR 1.7 (95% CI 1.1-2.6))(図4d, e)。多変量解析(年齢、病期などで調整)でもこの有意性は維持された(P=0.002)。末梢血白血球数と腫瘍内TAL組成の間には相関がなく、循環系と腫瘍内微小環境の独立性が示された。FACSおよび形態学的評価により、非小細胞肺癌 (NSCLC) 腫瘍では腫瘍隣接正常組織よりもPC浸潤が高いことも確認された(n=13 tumors)。

考察/結論

本研究は、約18,000例のヒト腫瘍データと39種類のがん種を統合したPRECOGリソースと、CIBERSORTを用いた腫瘍浸潤免疫細胞組成推定法を組み合わせることで、がんの生物学と臨床予後に関する複数の新規知見をもたらした。

先行研究との違い: これまでの研究が単一のがん種や限られた細胞タイプに焦点を当てていたのに対し、本研究は汎がん的な視点から大規模なメタ解析を実施した点で大きく異なる。特に、FOXM1-KLRB1複合スコアが、従来の臨床変数に加えて有意な予後情報を提供することを示した点は、Rooney et al. Cell 2015Galon et al. Science 2006のような個別の研究では得られなかった、より広範な予測能を提示するものである。

新規性: 本研究で初めて、FOXM1制御ネットワークが多様ながん種にわたる主要な予後不良因子であることを同定し、その中心的な役割を明らかにした。また、KLRB1(CD161)が汎がん的に予後良好因子であり、その発現がγδ T細胞やCD8+ T細胞といった抗腫瘍免疫細胞の浸潤を反映することを示した。さらに、22種類の白血球サブセットの汎がん的な予後予測マップを構築し、特に腫瘍関連PMN細胞と形質細胞 (PC) のシグネチャが、乳がんや肺腺がんを含む多様な固形腫瘍において逆相関する生存予測因子となることを新規に実証した。PMN/PC比率が単純かつ強力な予後指標となることは、これまで報告されていない重要な発見である。

臨床応用: 本研究で構築されたPRECOGリソース(http://precog.stanford.edu)と関連解析ツールは、将来の予測バイオマーカー、特に免疫療法に対する応答予測バイオマーカーの発見に極めて有用な基盤となる。例えば、[[NEnglJMed-2012-Topalian-Safety, activity, and immune correlates of anti-PD-1 antibody in cancer|Topalian et al. NEnglJMed 2012]]やRibas et al. NEnglJMed 2012が示すような免疫チェックポイント阻害剤の臨床的成功は、応答患者と非応答患者の免疫学的多様性の理解に依存する。本研究の手法は、多様な免疫エフェクター細胞を候補バイオマーカーとして特徴づけるフレームワークを提供し、PD-1/PD-L1標的療法を含む新規免疫療法の応答差異の解明、複数の免疫エフェクターの同時評価による治療応答予測、および治療誘発性のTAL変化を評価する薬力学的評価への応用可能性を提示する。腫瘍浸潤形質細胞が抗原駆動性のクローン増殖を反映する可能性は、新規の腫瘍関連抗原を標的とする抗体療法の開発につながる臨床的意義を持つ。

残された課題: 今後の検討課題として、肺扁平上皮癌など一部のがん種で予後関連性が比較的弱いことのメカニズム解明が挙げられる。また、CIBERSORTの入力参照プロファイルの忠実度、すなわち腫瘍内TALの実際の機能状態との乖離の可能性も残された課題である。形質細胞とPMN細胞の逆相反する予後予測能の免疫学的基盤、特に腫瘍関連PMN細胞がGabrilovich et al. NatRevImmunol 2009が報告する骨髄由来抑制細胞 (MDSC) と機能的に関連し、T細胞の抗腫瘍応答を抑制する役割を持つ可能性の検証が必要である。さらに、TAL間の相互作用や多変量相互作用の臨床応用、ネオアンチゲン特異性と抗体療法標的候補の同定、そして複合免疫療法の最適化のための機能的・空間的コンテクスト解析が今後の研究方向性として挙げられる。

方法

PRECOGリソースの構築とデータ前処理: NCBI GEO、EBI ArrayExpress、NCI caArray、Stanford Microarray Databaseから「survival」「prognosis」「prognostic」「outcome」に関連する遺伝子発現データセットを網羅的に収集した。これにより、39種類の異なる悪性組織型をカバーする166のがん発現データセット、約18,000例の全生存期間データ付き症例、および約30,000の発現プロファイルを統合した。全てのデータは手動でキュレーションされ、疾患状態、病期、組織型などの臨床パラメーターが検証された。結果の曖昧さを避けるため、全生存期間データのある約18,000例に解析を限定した。マイクロアレイデータは、カスタムCDFを用いたMAS5アルゴリズムで正規化され、各データセット内でクォンタイル正規化、log2変換、単位平均/分散標準化が施された。TCGA RNA-seqデータもTCGA-assemblerを用いてダウンロードおよび前処理された。

統計解析: 各遺伝子と生存転帰との関連性は、Rのsurvivalパッケージのcoxph関数を用いたCox比例ハザード回帰により評価され、z-scoreが算出された。z-scoreは統計的関連性の方向性と頑健性をエンコードし、異なる研究間での直接比較を可能にする。個々の研究のz-scoreは、Liptákの加重metazテストにより各がん種における遺伝子の予後予測能を示す「metaz-score」として統合された。さらに、全がん種にわたる各遺伝子の予後予測能を要約するため、Stouffer法(非加重)を用いて「グローバルmetaz-score」が算出された。FOXM1とKLRB1の二変量Coxモデルは、P<0.05(Wald検定)を有意とした。FOXM1-KLRB1複合スコアは、訓練セット(n=8データセット)から得られたCox回帰係数の中央値(FOXM1×0.243 + KLRB1×-0.169)を用いて定義された。このスコアは、内部および外部検証セット(TCGA RNA-seqデータを含む)で患者の生存層別化に用いられ、Kaplan-Meier曲線とログランク検定で評価された。

CIBERSORT解析: バルク腫瘍トランスクリプトームにおける白血球サブセットの相対的割合を推定するため、機械学習ツールCIBERSORT Newman et al. NatMethods 2015を適用した。入力として、22種類の異なる白血球サブセットの精製された発現プロファイルを使用し、これらの細胞タイプを頑健に識別する遺伝子発現シグネチャの「バーコード」を定義した。CIBERSORTは、Affymetrix HGU133プラットフォームのPRECOG GEPs(57研究、25がん種、n=5,782腫瘍)に適用され、各白血球サブセットの推定mRNA分画と生存との関連性がユニバリアントCox回帰により解析された。

検証: CIBERSORTの性能は、結腸直腸癌および肺腺癌における免疫組織化学 (IHC) またはフローサイトメトリー (FACS) データとの比較により検証された。特に、肺腺癌における腫瘍浸潤形質細胞 (PC) および多形核細胞 (PMN) の予後関連性は、187例の肺腺癌組織マイクロアレイ (TMA) を用いて実験的に評価された。TMAでは、MPO(PMNマーカー)、IGKC(PCマーカー)、CD20(成熟B細胞マーカー)の染色が定量され、CIBERSORT推定値とのSpearman相関が評価された。PMN/PC比率の予後予測能は、マイクロアレイデータおよびTMAデータでKaplan-Meier解析と多変量Cox回帰により確認された。末梢血白血球数とTAL組成の関連性も評価された。非小細胞肺癌 (NSCLC) 腫瘍細胞株であるA549細胞などを用いたin vitro実験は実施されていないが、in vivoでの細胞浸潤の評価に重点が置かれた。

ネットワーク解析: STRING v9.0を用いて、トップ予後遺伝子間のタンパク質-タンパク質関連 (PPA) ネットワークの連結性を評価した。ENCODE、ChEA、mSigDBの1,006の転写因子結合部位で定義された遺伝子セットとの統合により、FOXM1 ChIP-seq結合標的遺伝子の濃縮が解析された。