Immunopeptidomics-guided identification of functional neoantigens in non-small cell lung cancer

著者: Nicholas Ben, Bailey Alistair, McCann Katy J, Wood Oliver, Currall Eve, Peter Johnson, Tim Elliott, Christian Ottensmeier, Paul Skipp
Corresponding author: Dr Ben Nicholas (Centre for Proteomic Research, Biological Sciences and Institute for Life Sciences, University of Southampton; bln1@soton.ac.uk)
雑誌: npj Precision Oncology
発行年: 2026
Epub日: 2026-06-15
Article種別: Original Article
PMID: 42270771

背景

非小細胞肺がん (NSCLC) は、近年の免疫チェックポイント阻害薬の普及にもかかわらず、5年生存率が20%未満にとどまる極めて予後不良な疾患である。腫瘍特異的な体細胞変異に由来するネオアンチゲンを標的とした個別化がんワクチンは、正常組織へのオフターゲット効果や自己免疫疾患のリスクを最小限に抑えつつ、強力な抗腫瘍T細胞応答を誘導できる精密医療 (precision medicine) として大きな期待を集めている。しかし、治療に有効な機能的ネオアンチゲンを正確に同定することは極めて困難である。

これまでの先行研究において、腫瘍の遺伝子変異からネオアンチゲン候補を予測するアルゴリズムが多数開発されてきた。しかし、従来のゲノミクスおよび結合親和性予測のみに依存した手法では、予測された候補ペプチドのうち実際にT細胞応答を誘導できる「機能的ネオアンチゲン」の割合はわずか6%程度にとどまることが Wells et al. (2020) や Buckley et al. (2022) により報告されている。この低い成功率の原因として、遺伝子変異が実際に転写・翻訳され、抗原提示経路を経て主要組織適合遺伝子複合体 (HLA) 分子上に提示されるまでの複雑な生物学的プロセスを、単純な配列予測モデルでは十分にシミュレーションできない点が挙げられる。質量分析を用いた免疫ペプチドミクス (immunopeptidomics) は、実際に細胞表面に提示されているHLAリガンドを直接同定できる唯一の手法であるが、感度の限界から、1サンプルの測定で検出できるのは提示されている全ペプチドの極めて一部にすぎない。そのため、1人の患者の腫瘍変異から直接質量分析でネオアンチゲンを検出できる確率は統計的に約14%と低く、残りの86%は見落とされる計算になることが Newey et al. (2019) で示されている。

このように、ゲノム予測モデルの予測精度の低さと、質量分析による直接検出の感度不足との間には大きな「gap」が存在しており、個別化ワクチンの標的選定における決定的な「課題」となっている。さらに、患者個々のHLA提示傾向や、腫瘍内におけるHLAのヘテロ接合性消失 (LOH) などの生物学的多様性を考慮したネオアンチゲン選択アルゴリズムは「未確立」であり、個別化医療の現場で実用化するには提示予測の精度向上のための情報が決定的に「不足」している。

目的

本研究の目的は、NSCLC患者コホートを対象に、全エクソームシーケンス (WES)、トランスクリプトミクス (RNAseq)、および質量分析ベースのHLAクラスI・クラスII免疫ペプチドミクスを統合したプロテオゲノミクスアプローチを開発することである。患者個人の腫瘍およびコホート全体から得られる実際のHLA提示データ (提示傾向) をフィルターとして活用することで、予測されたネオアンチゲン候補から機能的なT細胞応答を誘発できる真のネオアンチゲンを高確率で同定する新規ワークフローを確立する。さらに、ベイズ多階層回帰モデリングを用いて、ドナー特異的な提示傾向とタンパク質レベルの提示パターンがペプチド提示確率に与える影響を定量的に解析し、ルールベースの選択手法の妥当性を統計的に検証することを目的とする。

結果

プロテオゲノミクスによるNSCLCの変異および提示景観の解明: WES解析により、肺腺がん (LUAD) 15例および肺扁平上皮がん (LUSC) 9例からなる計24例のNSCLCコホートにおける腫瘍遺伝子変異を同定した。コホート全体の腫瘍遺伝子変異量 (TMB) は、全変異においてLUADで中央値 109 Mt/Mb、LUSCで中央値 104 Mt/Mb といずれも高値を示した。ミスセンス変異のみに限定した場合、TMBは 5 から 43 Mt/Mb の範囲に分布し、中央値はLUADで 20 Mt/Mb、LUSCで 16 Mt/Mb であった (Fig 2A)。一塩基置換のパターン解析では、喫煙に関連する特徴的な C>A トランスバージョンが全体の約30%を占めていた (Fig 2B)。RNAseqデータを用いた免疫細胞浸潤推定では、CD4+ T細胞の浸潤割合 (中央値: LUAD 18%, LUSC 15%) に対し、CD8+ T細胞の浸潤割合は LUAD で 2%、LUSC で 1%未満と極めて限定的であった (Fig 2G)。一方、質量分析による免疫ペプチドミクスでは、クラスIペプチド (中央値: LUAD 5422個, LUSC 2998個) およびクラスIIペプチド (中央値: LUAD 2849個, LUSC 1125個) を同定した (Fig 3A)。

ドライバー遺伝子の変異頻度と提示頻度の乖離およびHLA LOHの反映: がん遺伝子および抑制遺伝子などのドライバー遺伝子における変異頻度と、実際のHLA提示頻度との関係を解析した結果、両者には相関が見られないことが明らかになった (Fig 4A)。例えば、APC などのドライバー遺伝子は頻繁に変異しているものの、その産物はHLA上にほとんど提示されない。これに対し、KEAP1 などのタンパク質は変異頻度が低いにもかかわらず、HLAペプチドーム中に高頻度で提示されていた。また、TP53 は変異頻度・提示頻度の双方が高い例外的な遺伝子であった。さらに、ゲノム上のHLAクラスI LOH (ヘテロ接合性消失) 解析をペプチドームデータと統合した結果、ゲノム上で保持されたHLAアレルに由来する提示ペプチドの割合は、消失したアレルに由来するペプチドと比較して有意に高値を示し、ゲノムレベルのLOHが実際の提示ペプチドームの偏りとして直接反映されていることが示された (Fig 4B)。

直接同定されたALYREFネオアンチゲンと細胞内局在による提示バイアス: 24例の患者コホート全体において、質量分析により直接検出されたミスセンス変異由来ネオアンチゲンは、LUAD患者A147における ALYREF (ALY/REF export factor) 遺伝子の Asp2Tyr 変異に由来する1種類のみであった (Fig S1)。この変異は、N末端のアラニンがアセチル化された 15-18mer のネストされたクラスIIペプチド群として検出され、患者の HLA-DRB1*03:01 アレルへの提示が示唆された。また、タンパク質の細胞内局在と提示経路の相関を解析した結果、クラスI提示ペプチドは核および細胞質由来のタンパク質に偏り、クラスII提示ペプチドは膜および細胞外領域のタンパク質に偏るという明確な提示バイアスが存在することが確認された (Fig 4C)。

免疫ペプチドミクスガイド下選択による高いT細胞反応率の達成: pVACseq により予測された膨大なネオアンチゲン候補 (クラスI: 27,466個, クラスII: 127,015個) に対し、「変異元のタンパク質が同ドナーのHLAペプチドーム中に提示されているか」および「HLAアレル特異的な好適ペプチド長に合致するか」という基準でフィルタリングを実施した。選定された70個の候補ペプチド (6例の患者に分配) を用いて、ドナー一致末梢血単核細胞 (PBMC) に対する IFN-γ ELISPOT (enzyme-linked immunospot) アッセイを実施した。その結果、テストした 6例中5例 (83.3%) において強力なネオアンチゲン特異的T細胞応答が確認された (Fig 5)。全候補ペプチド70個のうち9個 (12.8%) が陽性応答を示し、従来のゲノム予測のみの手法 (約6%) と比較して約2.1-fold の反応率向上を達成した (Table 2)。

ベイズ多階層モデルによる提示確率の定量化: ルールベース選択の妥当性を検証するため構築したベイズ回揮モデルにより、ペプチド提示確率を決定する要因を解析した (Fig 6)。分散成分分析の結果、LUSCコホートにおいてドナー特異的効果が提示分散に与える影響は、タンパク質特異的効果と比較してクラスIで 8倍、クラスIIで 22倍と極めて大きいことが示された (Fig 6C)。さらに、あるタンパク質由来のペプチドがコホート全体で広く提示されている場合、そのタンパク質から新たなペプチドが提示される確率は 18-23% 減少するのに対し、同一ドナーがすでにそのタンパク質由来のペプチドを1つでも提示している場合、別のペプチドが提示される確率は 23-41% 有意に上昇することが定量化された (Fig 6E)。

実験モデルにおける検証と統計的信頼性: 本研究の基礎的検証として、同一ドナー由来の PBMC を用いた in vitro T細胞刺激実験 (n=6 donors) を実施した。各ドナーの T細胞応答は 3回以上の独立した実験 (n=3 replicates) で再現性を確認した。ELISPOT アッセイにおけるスポット数の比較では、変異型ペプチド刺激群は野生型ペプチド刺激群と比較して有意に高い IFN-γ 産生細胞数を示し (p<0.001)、その効果量は log2FC 2.3x から log2FC 4.5x の範囲に分布していた。また、陽性対照として用いた CEFT ペプチドミックス刺激群でも強力な応答が確認され、アッセイ系の妥当性が示された。

考察/結論

先行研究との違い: 本研究は、従来のゲノム配列予測やMHC結合親和性予測のみに依存したネオアンチゲン選択手法と異なり、患者個人の腫瘍から得られた実際のHLAクラスIおよびクラスII免疫ペプチドミクスデータを直接的な「提示の生物学的証拠」として統合した点で決定的に異なる。従来の予測モデルでは機能的ネオアンチゲンの同定成功率が約6%にとどまっていたのに対し、本アプローチは実際の提示傾向をフィルタリングに用いることで、候補ペプチドレベルで 13% (70個中9個)、ドナーレベルで 83.3% (6例中5例) という極めて高いT細胞反応率を達成した。

新規性: 本研究は、個別化がんワクチンの設計において、単に予測スコアの高いペプチドを機械的に選択するのではなく、患者固有のHLA提示プロペンシティ (提示傾向) およびタンパク質の細胞内局在バイアスを考慮することの重要性を本研究で初めて実証した。さらに、ベイズ多階層回帰モデルを新規に導入し、同一ドナー内での特定タンパク質の提示実績が、新規ペプチドの提示確率を 23-41% も向上させるというドナー特異的提示バイアスを統計学的に初めて定量化した。

臨床応用: 本研究で確立されたプロテオゲノミクスワークフローは、個別化がんワクチン (mRNAワクチンや合成ペプチドワクチン) の開発におけるネオアンチゲン選定精度を劇的に向上させるための強力な基盤技術となる。臨床現場において限られた患者検体から無駄のない有効なワクチン組成を迅速に決定する上で、免疫ペプチドミクスデータを活用したフィルタリングシステムは極めて高い臨床的有用性を持つ。

残された課題: 今後の検討課題として、質量分析の感度限界によるペプチドの見落とし (偽陰性) を克服する必要がある。本研究の制限事項 (limitation) として、24例という比較的小規模なコホートでの検証にとどまっている点が挙げられ、今後はより大規模な患者集団での検証が必要である。また、今回は一塩基置換 (ミスセンス変異) 由来の標準的ネオアンチゲンのみを対象としたが、今後は環状RNA (circRNA) や未アノテーションオープンリーディングフレーム (nuORF) などの非標準的 (non-canonical) なゲノム領域から生じるネオアンチゲンの探索も重要な研究方向性となる。

方法

患者コホートと倫理声明: 本研究はヘルシンキ宣言に準拠して実施され、South Central Hampshire A研究倫理委員会 (参照番号: 14/SC/0186) の承認を得て、全患者から書面によるインフォームドコンセントを取得した。NSCLC患者24例 (LUAD 15例、LUSC 9例) の切除腫瘍組織、隣接正常組織、および末梢血単核細胞 (PBMC) を収集した。

ゲノムおよびトランスクリプトーム解析: 腫瘍および隣接正常組織から Maxwell RSC (Rapid Sample Preparation) 装置 (Promega) を用いてDNAおよびRNAを抽出した。全エクソームシーケンス (WES) は Agilent SureSelect Human All Exon V7 ライブラリを用いて調製し、Illumina NovaSeq 6000 システムを用いて約100倍の深度で 100 bp ペアドエンドシーケンスを実施した。リードのゲノムマッピングには BWA (version 0.7.17) を使用した。体細胞変異検出 (somatic variant calling) には Mutect2、Varscan (version 2.4.3)、Strelka (version 2.9.2) の3つのアルゴリズムを統合して使用した。RNAseqは TruSeq stranded mRNA ライブラリを用いて調製し、HISAT2 (version 2.1.0) でマッピング後、StringTie2 (version 1.3.5) を用いて遺伝子発現量を推定した。

質量分析ベースの免疫ペプチドミクス: 凍結腫瘍組織を溶解バッファー中で機械的にホモジナイズし、上清を回収した。抗MHC-I抗体 (W6/32) および抗MHC-II抗体 (IVA12; anti-MHC class II monoclonal antibody) を共有結合させた Protein A Sepharose ビーズを用いて、HLA-IおよびHLA-II複合体を順次免疫沈降した。10%酢酸を用いてペプチドを溶出し、逆相HPLC (C18 Chromolith column, Merck) を用いて分離・脱塩した。ナノLC-MS/MS解析は、Ultimate 3000 RSLC nano システムに接続した Orbitrap Fusion Tribrid 質量分析計 (Thermo Fisher Scientific) を用いて実施した。取得した生データは Peaks Studio 10.0 を用いて、UniProt ヒトデータベースおよび各患者固有の変異アミノ酸配列データベース (mutanome) に対して検索し、FDR (false discovery rate) 1% でフィルタリングした。

ネオアンチゲン予測と選択アルゴリズム: pVACseq (version 1.5.10) を用いて、患者のHLAアレルに対する 8-11mer (クラスI) および 15-mer (クラスII) のペプチド結合親和性を予測した。予測された候補ペプチドに対し、同ドナーのHLAペプチドーム中に同一ソースタンパク質由来の野生型ペプチドが存在するか否かでフィルタリングを行い、さらに COSMIC や Human Protein Atlas (HPA) などのデータベース情報を加味して手動キュレーションを行い、最終的なテストペプチドを選定した。

機能的T細胞アッセイと統計解析: 合成した変異型および野生型ペプチドを用いて、ドナー一致 PBMC (n=6 donors) を刺激培養した。IL-2 存在下で13日間培養して特異的T細胞を拡大させた後、IFN-γ ELISPOT アッセイ (AID ELISpot reader) を用いて特異的T細胞応答を定量化した。陽性判定には DFR (distribution-free resampling) 法を用いた。また、野生型と変異型ペプチド間の応答性の統計的比較には Student t-test および Mann-Whitney U test を用い、多群間比較には one-way ANOVA を使用した。

ベイズ統計モデリング: R言語上の brms パッケージおよび Stan を用いて、ペプチド提示確率に関するベイズ多階層ロジスティック回帰モデルを構築した。MCMCサンプリングは 4 chains、各 4000 iterations (warmup 1000) で実行し、収束判定にはトレースプロットおよびゲルマン・ルービン統計量 (R-hat < 1.05) を用いた。

Research Wiki

エクスプローラー

Immunopeptidomics-guided identification of functional neoantigens in non-small cell lung cancer

背景

目的

結果

考察/結論

方法

グラフビュー

目次

バックリンク