• 著者: Rachel RM. Pyke, Wesley Kurt Thompson, Rany M. Salem, Joan Font-Burgada, Maurizio Zanetti, Hannah Carter
  • Corresponding author: Hannah Carter (University of California San Diego)
  • 雑誌: Cell
  • 発行年: 2018
  • Epub日: 2018-09-06
  • Article種別: Original Article
  • PMID: 30245014

背景

がん免疫療法において、腫瘍特異的な変異に由来するネオ抗原の認識は、主に主要組織適合遺伝子複合体クラスIである MHC-I 分子に拘束されるCD8+細胞障害性T細胞の活性化に依存すると考えられてきた。先行研究において、個人のMHC-I遺伝型が腫瘍の変異スペクトラムを形成し、特定のドライバー変異の出現を制約することが示されている (Marty et al. Cell 2017)。しかし、MHCクラスIIである MHC-II 分子に拘束されるCD4+ヘルパーT細胞が、腫瘍の発生初期や進化の過程においてどのような免疫監視圧を与えているかについては、系統的な解析が行われておらず、その具体的な役割は未解明であった。CD4+ T細胞は、CD8+ T細胞へのヘルプ機能やB細胞の活性化、抗原提示細胞である APC (antigen-presenting cell) の動員といった多様な免疫調節能を有しており、臨床的にもCD4+ T細胞を標的としたネオ抗原ワクチンの有効性 (Ott et al. Nature 2017) や、CD4+ T細胞輸注療法による劇的な腫瘍退縮 (Tran et al. Science 2014) が報告されている。それにもかかわらず、個人のMHC-II遺伝型の多様性が、がんのドライバー変異の出現確率や腫瘍進化に与える進化的選択圧については、大規模なゲノムデータを用いた検証が圧倒的に不足していた。MHC-II分子はMHC-I分子と比較して、ペプチド結合の選択性がより緩やかであり、個人間の遺伝的多様性も異なるため、MHC-Iとは独立した、あるいは補完的な選択圧として機能している可能性があるが、その実態は不明なままであった。この知識のギャップを埋めるため、大規模な患者コホートにおけるMHC-II遺伝型と腫瘍ゲノムの相互作用を定量的に評価することが求められていた。さらに、全身性免疫ががん免疫療法において必須であるという知見 (Spitzer et al. Cell 2017) もあり、CD4+ T細胞の役割の解明は急務であった。このように、MHC-IIを介した免疫監視の進化的影響に関する大規模なゲノム解析は未開拓の領域であり、がんゲノム進化におけるCD4+ T細胞の選択圧を定量化するアプローチが強く望まれていた。

目的

本研究の目的は、TCGA (The Cancer Genome Atlas) の患者コホートから得られた大規模なゲノムデータを用いて、個人のMHC-II遺伝型が腫瘍のドライバー変異スペクトラムに与える進化的制約を定量的に評価することである。具体的には、個人のMHC-II遺伝型と特定の腫瘍変異の提示能を数値化する新しいスコアリングシステムである PHBR-II (patient harmonic-mean best rank class II) スコアを開発・検証し、これを用いてMHC-IIががんの発生過程においてどのような選択圧として機能しているかを明らかにする。さらに、MHC-Iによる選択圧を評価する PHBR-I (patient harmonic-mean best rank class I) と、MHC-IIによる選択圧 (PHBR-II) の強さや特性を直接比較し、CD4+ T細胞とCD8+ T細胞による免疫監視が腫瘍進化においてどのように協調、あるいは異なる役割を果たしているかを解明することを目指す。また、MHC-IIの提示多様性が個人のがん感受性や発症年齢に与える影響を解析し、臨床的な個別化医療や免疫療法のバイオマーカーとしての可能性を探る。これにより、腫瘍進化におけるMHC-II拘束性免疫監視の寄与を包括的に理解することを目的とする。

結果

PHBR-IIスコアの開発と質量分析データによる提示予測能の検証: 本研究では、個人のMHC-II遺伝型が特定の変異ペプチドを提示する能力を定量化するため、PHBR-IIスコアを新たに開発した。このスコアの予測精度を検証するため、7名のドナーから得られたHLA-DRのマルチアレリック質量分析データ (n=7 donors) を用いて、実際の細胞表面に提示されたペプチドとランダムなペプチドの判別能を評価した。その結果、PHBR-IIスコアは実際のペプチド提示を AUC=0.69 の精度で予測可能であることを示した (Fig 1E)。この予測精度は、MHC-IIのペプチド結合領域が両端に開いているという構造的複雑性を考慮すると、極めて有用なシグナルを保持していると判断された。また、15-merペプチドを用いた予測モデルは、13-merから25-merを用いたモデルよりも高い予測能を示した (Fig S1A)。

がんドライバー変異におけるMHC-II提示能の著しい低下と負の選択: TCGAの患者コホート (n=5942 patients) において、1,018個のがんドライバー変異に対する個人のPHBR-IIスコアを算出し、他のアミノ酸残基クラスと比較した (Fig 2)。ウイルス由来残基 (27%がPHBR-II閾値6以下) や細菌由来残基 (29%が閾値6以下) といった病原体由来ペプチドは、MHC-IIによって効率的に提示されることが示された (Fig 3A)。これに対し、頻繁に観察されるがんドライバー変異 (特に腫瘍抑制遺伝子の変異) では、PHBR-IIスコアが著しく高く、MHC-IIに提示されやすい閾値6以下の割合はわずか7%にとどまった (p<0.001, Fig 3B)。この顕著な提示能の低下は、がん化の初期段階においてMHC-IIに提示されやすい変異を持つクローンが、CD4+ T細胞による免疫監視によって効果的に排除 (負の選択) された結果、生き残った腫瘍ではMHC-IIから逃避した変異のみが選択的に蓄積していることを強く示唆している。また、野生型配列と変異型配列の提示能の相関は極めて高かった (Pearson r=0.96, Fig S3B)。

ドライバー変異の出現頻度とMHC-II提示能の正の相関: 腫瘍集団内での変異の出現頻度 (recurrence) と、個人のMHC-II提示能との関連を解析した。その結果、ドライバー変異の出現頻度が高くなるにつれて、PHBR-IIスコアが有意に上昇する (提示能が低下する) という強い正の相関が確認された (Fig 3C)。具体的には、低頻度 (出現回数5回以下、n=841) のドライバー変異では20%がPHBR-II閾値6以下であったのに対し、高頻度 (出現回数20回超、n=28) のドライバー変異ではわずか8%のみが閾値以下であった (p<0.001, Fig 3D)。ロジスティック回帰モデルを用いた解析では、PHBR-IIスコアの対数値が1単位増加する (提示能が低下する) ごとの変異出現オッズ比は OR=1.23 (95% CI 1.19-1.26, p<0.001) と高度に有意であった (Table 1)。一方で、乗客変異 (OR=1.00) や生殖細胞系変異 (OR=0.99) ではこのような相関は一切認められず、この進化的選択圧ががんのドライバー変異に極めて特異的であることが実証された。

MHC-IとMHC-IIによる選択圧の直接比較と相補的機能: MHC-Iによる選択圧 (PHBR-I) とMHC-IIによる選択圧 (PHBR-II) の強さを同一の患者コホート (n=5942 patients) で直接比較するため、両スコアを組み込んだ複合ロジスティック回帰モデルを構築した。その結果、PHBR-IIの変異出現に対する影響は、25thから75thパーセンタイルへの増加において 1.74-fold (95% CI 1.67-1.80, p<0.001) であり、PHBR-Iの影響である 1.60-fold (95% CI 1.54-1.64, p<0.001) を統計学的に有意に上回ることが明らかとなった (Fig 5B)。また、個人のPHBR-IスコアとPHBR-IIスコアの相関を解析したところ、全体としての相関は極めて弱く (Spearman rho=0.36)、両者が相補的な選択圧として機能していることが示された (Fig 5A)。がん種別の解析では、解析した18がん種のうち12がん種においてMHC-IIによる選択圧が有意 (p<0.05) であり、特に甲状腺がんにおいて強力な効果 (OR=2.63 vs MHC-IのOR=2.21) が観察された (Fig 4C)。

腫瘍のクローン性と免疫選択圧の強度変化: 腫瘍進化のタイムスケールにおける免疫選択圧の変化を検証するため、変異のクローン性 (腫瘍細胞全体に存在するクローナル変異か、一部にのみ存在するサブクローナル変異か) に基づいた解析を行った。アレル頻度 (allelic fraction) の情報を用いて変異を分類し、ロジスティック回帰モデルを適用した。その結果、腫瘍発生の初期段階に生じるクローナル変異 (高アレル頻度群) において、MHC-IIによる選択圧は OR=1.29 (95% CI 1.23-1.35, p<0.001) と非常に強力であった (Fig 5C)。これに対し、腫瘍が免疫逃避機構を獲得した後に生じる傾向があるサブクローナル変異 (低アレル頻度群) では、MHC-IIによる選択圧は OR=1.13 (95% CI 1.08-1.18, p<0.001) へと有意に減弱していた (Fig 5C)。この結果は、腫瘍が進化し微小環境における免疫逃避を達成するにつれて、MHC-IIを介したCD4+ T細胞による進化的制約から脱却していくプロセスを時間軸に沿って明確に示している。

MHC提示多様性とがん発症年齢との関連性: MHC-IとMHC-IIの提示特性の違いが、個人のがん感受性や発症年齢に与える影響を解析した。個人のMHC遺伝型が提示可能なドライバー変異の割合を示す「MHCカバレッジ」を算出し、発症年齢との相関を評価した。MHC-Iカバレッジが高い患者 (提示可能な変異が多い個人) では、がんの発症年齢が有意に遅くなる正の相関が認められ、カバレッジの最上位5%と最下位5%の患者間では発症年齢に平均 4.0 ± 0.5 年の差が存在した (p=0.01, Fig 6D)。しかし、対照的にMHC-IIカバレッジと発症年齢との間には有意な相関は認められなかった (p=0.51, Fig S7A)。この違いは、MHC-Iを介したCD8+ T細胞による直接的な細胞障害活性ががんの発生を直接遅延させるのに対し、MHC-IIを介したCD4+ T細胞の役割は、直接的な殺傷よりも、免疫微小環境の制御やCD8+ T細胞の活性化維持といった間接的かつ複雑な調整機能に依存しているため、単純なカバレッジと発症年齢の相関としては現れにくいことを示唆している。なお、コントロールとして解析した非がんコホート (n=1219 patients for MHC-II, n=1386 patients for MHC-I) でも同様の提示傾向が確認された (Fig S4D)。また、MHC-IおよびMHC-IIの多様性と、ドライバー変異カバレッジおよび乗客変異カバレッジは強く相関していた (MHC-I Pearson r=0.79, MHC-II Pearson r=0.68, Fig 6A, Fig 6B)。

考察/結論

先行研究との違い: 従来の腫瘍免疫ゲノミクス研究においては、ネオ抗原の提示とそれに対する免疫監視は主にMHC-I拘束性のCD8+ T細胞に依存すると考えられてきた (Marty et al. Cell 2017)。これに対し、本研究はMHC-II拘束性のCD4+ T細胞による免疫監視が、MHC-Iと同等かそれ以上に腫瘍のドライバー変異スペクトラムを強力に制約していることを示しており、これまでのCD8+ T細胞中心のがん免疫監視モデルと異なり、CD4+ T細胞が腫瘍進化の極めて初期段階から主導的な役割を果たしていることを浮き彫りにした。また、HLAクラスIのヘテロ接合性消失 (LOH) が免疫逃避に関与するという既報 (McGranahan et al. Cell 2017) や、患者のHLA-I遺伝型が免疫チェックポイント阻害剤の治療効果に影響を与えるという報告 (Chowell et al. Science 2018) と比較しても、MHC-II遺伝型が腫瘍発生の極めて初期段階から強力な選択圧として機能していることを示した点は、これまでの知見と対照的である。

新規性: 本研究は、5,942例という大規模なTCGAコホートにおいて、個人のMHC-II遺伝型と1,018個のがんドライバー変異の発生確率との関連を本研究で初めて系統的に明らかにした。特に、MHC-IIによる選択圧がクローナルな初期変異において最も強く作用し、サブクローナルな後期変異では減弱するという、腫瘍進化のタイムスケールに沿った免疫編集の動態を新規に提示した点は、これまで報告されていない画期的な知見である。

臨床応用: 本研究の知見は、がん免疫療法の設計における臨床応用に極めて重要な示唆を与える。MHC-IIによる提示能はMHC-Iと比較して患者間での多様性が低く、比較的均一であるという特性は、より広い患者集団に適用可能な「共通ネオ抗原」を標的としたがんワクチンの開発において高い臨床的有用性を持つ。さらに、個人のMHC-II遺伝型 (PHBR-IIスコア) を解析することで、患者ごとにどのドライバー変異が免疫監視を逃れて出現しやすいかを予測することが可能となり、臨床現場における個別化医療や、免疫チェックポイント阻害剤の治療効果予測バイオマーカーとしての応用が期待される。

残された課題: しかしながら、今後の検討課題としていくつかのlimitationが挙げられる。第一に、本研究で用いられたPHBR-IIスコアはin silicoでのペプチド結合親和性予測に基づいているため、実際の抗原提示細胞上での提示や T細胞受容体である TCR (T cell receptor) による認識効率を完全には反映していない点である。第二に、MHC-IIカバレッジががんの発症年齢と相関しなかった理由について、CD4+ T細胞のヘルパー機能や、調節性T細胞である Treg (regulatory T cell) などの免疫抑制的機能の複雑な相互作用を解明するための、さらなる機能的検証が今後の研究で必要とされている。

方法

本研究では、TCGAに登録されたがん患者のうち、全エクソーム解析である WES (whole exome sequencing) データが存在し、高品質な HLA (human leukocyte antigen) タイピングが可能な5,942例を対象とした。HLAクラスII遺伝型である HLA-DRB1、HLA-DPA1 / HLA-DPB1、HLA-DQA1 / HLA-DQB1 の決定には、次世代シーケンシングである NGS (next-generation sequencing) データから高精度にアレルを同定できるツールである HLA-HD を採用し、さらに xHLA ツールとの一致を確認したサンプルのみを厳選した。

個人のMHCクラスII遺伝型による特定の変異提示能を評価するため、PHBR-IスコアをMHC-II用に拡張したPHBR-IIスコアを開発した。具体的には、netMHCIIpan-3.1を用いて、HLA-DR、HLA-DP、HLA-DQ の各ヘテロ二量体 (計12通りの組み合わせ) に対する15-merペプチドの結合親和性を予測した。各変異残基を含むすべての15-merペプチドの中で最良の予測ランク (best rank) を算出し、これら12組の最良ランクの調和平均を求めることで、個人ごとのPHBR-IIスコアを定義した。

PHBR-IIスコアの妥当性を検証するため、既報のマルチアレリック質量分析である MS (mass spectrometry) データ (HLA-DRに提示された実際のペプチドデータ) を使用した。予測アルゴリズムのベンチマークとして、HEK293TA549 などの一般的なヒト細胞株データ、および 7 donors 由来の細胞株の MS データを使用し、データベース Ensembl および UniProt からランダムに抽出したペプチドを対照群として、ROC (receiver operating characteristic) 曲線下面積である AUC (area under the curve) を算出する検証を行った。

統計解析においては、1,018種の既知のがんドライバー変異 (Lawrence et al. Nature 2013) を対象とし、変異が実際に観察された患者群と観察されなかった患者群の間でPHBR-IIスコアの分布を比較した。この比較には Mann-Whitney U test および Fisher's exact test を用いた。さらに、個人のPHBR-IIスコアが特定のドライバー変異の出現確率に与える影響を定量化するため、患者ごとの変異感受性の違いをランダム効果として組み込んだロジスティック回帰分析モデルを構築した。MHC-IとMHC-IIの選択圧を同時に評価するため、PHBR-IとPHBR-IIの双方を共変数として含む複合ロジスティック回帰モデルも構築し、それぞれのオッズ比である OR (odds ratio) を算出した。また、MHC-IおよびMHC-IIのスコア間の相関関係を評価するため、Spearman correlation および Pearson correlation を用いた。腫瘍浸潤リンパ球の評価には、遺伝子発現プロファイルから細胞サブセットを推定するアルゴリズムである CIBERSORT (Cell-type Identification By Estimating Relative Subsets Of RNA Transcripts) (Newman et al. NatMethods 2015) を用いた。