• 著者: Shukla SA, Rooney MS, Rajasagi M, Tiao G, Dixon PM, Lawrence MS, Stevens J, Lane WJ, Dellagatta JL, Steelman S, Sougnez C, Cibulskis K, Kiezun A, Hacohen N, Brusic V, Wu CJ, Getz G
  • Corresponding author: Catherine J Wu (Dana-Farber Cancer Institute, Boston, USA) & Gad Getz (Broad Institute of MIT and Harvard, Cambridge, USA)
  • 雑誌: Nature Biotechnology
  • 発行年: 2015
  • Epub日: 2015-09-15
  • Article種別: Original Article (Computational Analysis)
  • DOI: 10.1038/nbt.3344

背景

ヒト白血球抗原 (HLA; human leukocyte antigen) クラス I 分子は第 6 染色体の MHC (major histocompatibility complex) 領域にコードされ、腫瘍由来ネオアンチゲンペプチドを CD8 陽性 T 細胞に提示する免疫監視機構の中枢を担う。癌ゲノムへの体細胞変異の蓄積は腫瘍免疫逃避の重要な機序の一つとして認識されており、Stransky et al. (2011) が頭頸部扁平上皮癌において HLA クラス I 遺伝子の高頻度体細胞変異を初めて報告し、Lohr et al. (2012) はびまん性大細胞型 B 細胞リンパ腫 (DLBCL; diffuse large B-cell lymphoma) の全エクソーム解析でも HLA 変異の存在を示し、Lawrence et al. (2014) の 21 癌種横断パンキャンサー解析でも HLA 遺伝子が主要変異遺伝子として浮上していた。しかし既存の全エクソーム配列 (WES; whole-exome sequencing) 解析パイプラインでは、ヒトゲノム中最も多型性の高い領域のひとつである HLA 遺伝子座 (各遺伝子で数千の既知アレルを持つ) への標準的参照ゲノムへのリードアラインメントが困難であり、体細胞変異の偽陰性・偽陽性率が高いという根本的な技術的障壁があった。そのため、どの癌種でどの程度の頻度で HLA 変異が蓄積し、どの機能的領域が選択されるか、また T 細胞浸潤との関連で免疫回避に寄与するかは未解明のままであった—正確なアルゴリズムなしには多癌種横断の系統的検証が不可能であり、HLA 体細胞変異の癌免疫学的意義を定量化するうえで根本的な知識の空白が存在していた。

目的

WES データから個人固有の HLA クラス I アレル (HLA-A、HLA-B、HLA-C) を高精度に推定し、推定アレルを参照配列として用いることで HLA 遺伝子内の体細胞変異を高感度かつ高特異的に検出するアルゴリズム Polysolver (polymorphic loci resolver; ポリゾルバー) を開発する。本アルゴリズムを TCGA 7,930 例の腫瘍・正常対 WES データに適用し、癌種横断での HLA 体細胞変異の包括的なカタログを構築して変異の機能的意義および腫瘍免疫との関連を解明することを目的とする。

結果

Polysolverによる HLA 型推定は感度97%・精度98.8%を達成し既存5ツール中4ツールを凌駕する

n=253 例の HapMap サンプル (既知 HLA ゲノタイプ) を用いた独立検証セットにおいて、Polysolver はタンパクコード領域レベルでの HLA 型推定において全体平均感度 97% (83% のサンプルで全アレル種を正確に同定)、全体平均精度 98.8% (93.6% のサンプルで誤同定アレルなし)、全体平均正確度 97%、ホモ接合成功率 100% (83/83 例) を達成した (Fig 1b)。比較検討した既報 5 アルゴリズムのうち 4 ツールを全指標で上回り、OptiType とは同等の性能を示した。ライブラリサイズ 5〜170 百万リードの幅広い範囲で安定した性能を維持した。

TCGA 7,930例解析により266例 (3.3%) に298件の体細胞HLA変異が同定される

7,930 例 (TCGA 由来 7,801 例 + CLL・黒色腫の別コホート 129 例) の腫瘍・正常対 WES データを Polysolver ベースの変異検出パイプラインで解析した結果、n=266 例 (3.3%) に合計 298 件の非サイレント HLA 体細胞変異が同定された (Supplementary Tables 11、12)。体細胞変化のアレル分率中央値は 33% (四分位範囲 16〜58%) であり、大半がヘテロ接合性変異であることが示唆された (Fig 2b)。2,545 例での事前検証では、標準法の TCGA が検出した 59 件の既報変異のうち 36 件 (61%) を再検出し、さらに 37 件の新規変異を追加同定 (計 73 件)、RNA シーケンスによる検証で感度 58.8%→94.1%、特異度 20%→53.3% への改善が確認された (Fig 2d)。

体細胞HLA変異は癌種特異的に分布し大腸腺癌が新規の有意変異癌種として同定される

癌種別解析では変異頻度・局在・種別に明確な差異が観察された (Fig 3)。既報の頭頸部扁平上皮癌 (HNSC、HLA-A/B)、肺扁平上皮癌 (LUSC、HLA-A)、胃腺癌 (STAD、HLA-B) に加え、大腸腺癌 (COAD) において HLA-A (FDR q = 2.3×10^-8) および HLA-B (FDR q = 3.9×10^-7) が統計的に有意に変異することが新規に同定された。一方、慢性リンパ性白血病 (CLL; n=128) および肝癌 (n=202) では HLA 変異が完全に欠如し、膠芽腫 (n=390) および甲状腺癌 (n=486) でも変異は散発的であった。298 件中 214 件 (71.8%) は 64 か所の再発性ポジション (≥2 例で変異) に集積し、うち 29 か所が ≥3 例の変異を有した。

機能的損失変異の有意な濃縮と抗原提示機能領域への選択的集積が正の選択を支持する

HLA 変異におけるスペクトル解析で、ナンセンス変異・フレームシフト挿入欠失・スプライスサイト変異といった機能的損失 (loss-of-function) イベントが非 HLA 変異と比較して有意に濃縮されていた (カイ二乗検定 p < 2.2×10^-16、Fig 4a)。機能的損失変異はリーダーペプチド配列の N 末端に顕著な選択的集積を示し (p = 0.0038)、完全な非機能型タンパク産生につながる変異が正の選択を受けていることが示唆された。エクソン別の変異分布では、CD8 補助受容体と結合する α3 ドメインをコードするエクソン 4 が最多 (118 件、39.6%)、続いてペプチド提示に関与するエクソン 3 (56 件、18.8%)、エクソン 2 (49 件、16.4%) であった (Fig 4b)。ペプチド結合ドメイン内変異の 28.6% (30/105 件) がペプチドとの実際の接触残基に位置し、そのうち 80% (24/30 件) が 2 つの主要アンカー溝構成残基であり、MHC-ペプチド複合体安定性を根本的に損なう変異が選択されていることが示された (Fig 4c)。

HLA変異腫瘍はエフェクターリンパ球浸潤シグネチャーの高発現と関連し免疫回避の証拠を示す

11 癌種 4,512 例の RNA シーケンスデータを用いた非バイアス遺伝子発現解析では、HLA 変異を有する腫瘍でエフェクターリンパ球浸潤マーカーの発現が一貫して上昇していた (Fig 4d)。最も有意な上位遺伝子はインターフェロンγ (IFNG)、T 細胞誘引性ケモカイン (CXCL9、CXCL10、CXCL11)、溶解性分子 (GZMA、グランザイム H/GZMH (granzyme H)、PRF1、GNLY)、および細胞傷害活性メタ遺伝子 (GZMA と PRF1 の幾何平均) であり、6/11 癌種 (胃癌、子宮内膜癌、子宮頸癌、頭頸部癌、大腸癌、神経膠腫) で Wilcoxon 片側順位和検定 p < 0.00005 の有意な関連が認められた。これは HLA 変異が高 T 細胞浸潤環境下で免疫圧による選択を受け、HLA クラス I 機能の損失を通じて腫瘍細胞が T 細胞・NK 細胞による破壊を回避するという免疫回避仮説に合致する結果である。

考察/結論

本研究は WES データからの HLA クラス I 型精密推定アルゴリズム Polysolver を確立し、7,930 例の多癌種 TCGA データに適用することで体細胞 HLA 変異の包括的なカタログを初めて構築した。

① 先行研究との違い: Stransky et al. (2011) や Lawrence et al. (2014) が標準的参照ゲノムアラインメントで同定した既報変異と対照的に、Polysolver ベースの方法は RNA シーケンスによる独立検証で感度 58.8%→94.1%、特異度 20%→53.3% へ大幅に改善した。標準法が発見した変異の 39% は実は偽陽性であった一方、Polysolver は多数の新規変異を追加同定した。また既報研究の多くは単一癌種にとどまっていたのに対し、本研究で初めて大腸腺癌が有意な HLA 変異癌種として同定された。他の免疫回避研究 (Matsushita et al. Nature 2012) が mRNA 発現低下による HLA 欠失に焦点を当てていたのと異なり、本研究は HLA 蛋白質をコードする遺伝子の体細胞変異という補完的機序の規模を系統的に示した。

② 新規性: 本研究の新規な貢献は 3 点ある。(1) Polysolver という個人固有 HLA アレルを WES から高精度推定する計算アルゴリズムをこれまでにない精度で確立した点。(2) 7,930 例規模の多癌種横断で HLA 変異を系統的にカタログ化した点。(3) HLA 変異が機能的損失変異に富み、抗原提示の核心機能領域 (ペプチドアンカー溝・CD8 結合 α3 ドメイン) に集積し、高エフェクター T 細胞浸潤腫瘍でこそ選択される—という免疫回避の正の選択証拠を包括的に示した点である。これはのちに Naranbhai et al. LancetOncol 2022 が示した HLA アレル型と免疫チェックポイント阻害剤応答との関連研究の基盤となる。

③ 臨床的意義: HLA クラス I の体細胞変異は癌免疫療法の有効性に直接影響する。MHC クラス I 機能の損失は腫瘍由来ネオアンチゲンの T 細胞への提示を阻害し、PD-1/PD-L1 阻害剤の機序的前提を損なうため、免疫チェックポイント阻害剤の一次耐性や無効例の重要な予測因子となりうる。臨床応用として、WES ベースの Polysolver は腫瘍 HLA 変異の前向きスクリーニングへの活用が期待され、Vilarino et al. MolCancer 2026 が示すような脳転移等での HLA クラス I 発現低下との統合的解釈も今後重要となる。また Polysolver の HLA 型推定精度は臓器移植マッチング・自己免疫疾患の遺伝的感受性研究など免疫学的応用にも展開可能である。

④ 残された課題: 今後の検討として、Polysolver の既知アレルデータベース依存性 (IMGT/HLA に未登録の新規アレルは検出不能) の解消が挙げられる。また本研究はコーディング変異を対象としており、HLA 調節領域や MHC クラス II・MHC クラス I 非古典的分子 (TAP1/TAP2、MHC クラス I 連鎖関連タンパク MIC-A (MHC class I chain-related protein A)/MIC-B 等) への拡張は今後の課題である。さらに高 T 細胞浸潤腫瘍での HLA 変異選択という観察相関を直接的に証明するための実験的介入研究、特に HLA 変異単独の免疫回避効果を in vivo モデルで検証する研究が不足している。臨床的には、WES の HLA 領域カバレッジ向上・ロングリードシーケンス (PacBio RSII) との統合による精度向上が期待されるが、臨床ルーティン使用には >99.9% の精度要件への対応が今後の方向性として残されている。

方法

n=7,930 例の腫瘍・正常対 WES データを解析した (TCGA 由来 20 癌種 7,801 例 + CLL n=129 例を含む外部コホート)。アルゴリズム Polysolver は 3 ステップで構成される: (1) ImMunoGeneTics/HLA (IMGT/HLA) データベース (6,597 アレル) を参照したHLA リードの抽出 → (2) Novoalign による高精度アラインメント → (3) 塩基品質・インサートサイズ・民族依存事前確率を組み込んだ 2 段階ベイズ分類による個人固有 HLA アレル推定。体細胞変異検出は、推定アレルを患者固有参照として腫瘍・正常リードを再アラインメントし、MuTect (点変異) および Strelka (挿入欠失) を適用した。検証: (a) 既知 HLA ゲノタイプを持つ n=253 HapMap サンプルでの独立精度検証、(b) n=49 例の RNA シーケンスを用いた変異発現検証 (≥2 本のアルタネートアレルリードを陽性基準)、(c) n=18 例での Pacific Biosciences RSII ロングリード直接 HLA 塩基配列決定による実験的検証。遺伝子発現解析: n=4,512 例・11 癌種の RNA シーケンスデータで 18,000 遺伝子を対象に HLA 変異例対野生型例の発現比較を実施した。統計解析: カイ二乗検定 (HLA 変異 vs 非 HLA 変異における変異スペクトル差異; p < 2.2×10^-16)、FDR 補正 (q 値; 癌種別有意変異遺伝子の同定; HLA-A q=2.3×10^-8、HLA-B q=3.9×10^-7 in 大腸腺癌)、ウィルコクソン片側順位和検定 (HLA 変異 vs 野生型の遺伝子発現比較; p<0.05 および p<0.00005 の 2 段階閾値)、フィッシャーの方法 (複数癌種での遺伝子発現関連の統合 p 値算出; 閾値 p<10^-10)。データ登録: dbGaP アクセッション番号 phs000178。