Machine learning reveals a PD-L1-independent prediction of response to immunotherapy of non-small cell lung cancer by gene expression context

著者: Wiesweg M, Mairinger F, Reis H, Goetz M, Kollmeier J, Misch D, Stephan-Falkenau S, Mairinger T, Walter RFH, Hager T, Metzenmacher M, Eberhardt WEE, Zaun G, Köster J, Stuschke M, Aigner C, Darwiche K, Schmid KW, Rahmann S, Schuler M
Corresponding author: Martin Schuler (Department of Medical Oncology, West German Cancer Center, University Hospital Essen, Hufelandstrasse 55, 45122 Essen, Germany; martin.schuler@uk-essen.de)
雑誌: European Journal of Cancer
発行年: 2020
Epub日: 2020-10-12
Article種別: Original Article
PMID: 33059196

背景

抗PD-1/PD-L1免疫チェックポイント阻害薬 (ICI) は非小細胞肺がん (NSCLC) の治療体系を劇的に変化させたが、その治療効果を享受できる患者は一部に留まる。現在、日常臨床で標準的に用いられている予測バイオマーカーは、免疫組織化学 (IHC) 染色による腫瘍細胞上のPD-L1発現レベル (腫瘍比率スコア: TPS) である。TPS 50%以上の患者にはペムブロリズマブ単剤療法が、TPS 1%以上の患者にはニボルマブとイピリムマブの併用療法が一次治療の選択肢として推奨されている (Reck et al. NEnglJMed 2016、Hellmann et al. NEnglJMed 2019)。しかし、PD-L1 IHCは感度および特異度の双方において不十分であり、PD-L1高発現患者であっても奏効しない例や、逆にPD-L1陰性患者であっても長期的な治療効果が得られる例が少なからず存在するという根本的な限界を抱えている。

もう一つのバイオマーカー候補として腫瘍変異量 (TMB) も評価されてきた。後向きコホートや第III相試験の探索的解析では一定の予測価値が示されたが (Hellmann et al. NEnglJMed 2018、Carbone et al. NEnglJMed 2017)、全生存期間 (OS) に対する予測能については相反する結果が報告されており、測定法の標準化不足や技術的・コスト的障壁が臨床実装を阻んでいる。さらに、化学免疫療法併用時におけるTMBの予測価値の低下も懸念されている。これらの既存バイオマーカーの限界は、腫瘍微小環境 (TME) における複雑な免疫細胞の相互作用や「免疫コンテキスト (文脈)」を単一の指標では十分に捉えきれていない点に起因すると考えられる。

腫瘍微小環境における免疫関連遺伝子の発現パターンがICIの応答性を規定するという仮説に基づき、インターフェロンガンマ (IFN-γ) 誘導性遺伝子発現プロファイルなどの「腫瘍炎症シグネチャー」が提案され、複数の癌種で治療効果との関連が報告されてきた (Ayers et al. JClinInvest 2017)。しかし、これらの既報シグネチャーは本研究の対象コホートにおいて有意な予測能を示さず、既存の知見を異なる患者背景を持つコホートへそのまま一般化することには限界があった。このように、複雑な腫瘍免疫微小環境を正確に評価し、ICI治療の恩恵を受ける患者を精緻に選別するための高精度なバイオマーカーは未だ確立されておらず、臨床における大きな知識ギャップ (knowledge gap) となっている。

NanoString nCounterプラットフォームは、ホルマリン固定パラフィン包埋 (FFPE) 組織から抽出した微量のRNAを用いて多重遺伝子発現プロファイリングを可能にする技術であり、臨床現場への実装が極めて容易である。NSCLCの診断では低侵襲な気管支鏡生検による小組織しか得られないことが多く、このような限られた検体から得られる遺伝子発現データを機械学習 (ML) アルゴリズムと組み合わせることで、個別遺伝子の発現強度のみに依存しない、複数遺伝子の「発現コンテキスト」を統合した高度な予測モデルの構築が可能になると期待される。既存のPD-L1 IHC単独による評価の不足を補い、より高精度な個別化医療を実現するための新たなアプローチが強く求められている。

目的

本研究の目的は、Stage IVの進行・再発NSCLC患者の診断時に採取されたFFPE生検組織を用い、NanoString nCounter PanCancer Immune Profiling panel (770遺伝子) による免疫関連遺伝子発現プロファイルを解析することである。さらに、この多次元データに対して機械学習 (ML) 手法を適用することで、抗PD-1/PD-L1抗体療法 (ITx: immunotherapy) の治療奏効および治療失敗までの期間 (TTF: time to treatment failure) を予測する最適な遺伝子発現シグネチャーモデルを構築することを目指した。構築されたモデルの予測精度を独立した2つの検証コホートにおいて検証するとともに、現在臨床で標準的に用いられているPD-L1 IHCによるTPS評価との独立性および相補性を評価し、実臨床においてPD-L1 IHC単独での選別能の不足を克服し得る、新たな直交的 (orthogonal) バイオマーカーとしての臨床的有用性を実証することを目的とした。

結果

22遺伝子シグネチャーの同定と特徴量選択: 訓練コホート (n=55) におけるLasso回帰アンサンブルサブサンプリングにより、770遺伝子から予測価値の高い22遺伝子が同定された (Table 1)。このうち、RNA発現モデルにおいて特に重要度の高かった主要な遺伝子には、抗原提示に関与するCD1A (T-cell surface glycoprotein CD1a)、単球・マクロファージ機能に関与するCCL7 (C-C motif chemokine 7) およびIL-18 (interleukin-18)、免疫応答調節に関与するF2RL1 (F2R Like Trypsin Receptor 1) およびCAMP (cathelicidin antimicrobial peptide)、好中球エラスターゼをコードするELANE (neutrophil elastase)、インターフェロン誘導経路に関与するIFITM1 (interferon-induced transmembrane protein 1) およびIFI16 (gamma-interferon-inducible protein 16)、ならびに機能未知のZNF346 (zinc finger protein 346) が含まれていた。

訓練コホートにおけるモデル性能と識別能: 訓練コホート (n=55) において、クロスバリデーションを用いた最良奏効予測モデルは極めて高い精度を示した。特に、持続的臨床ベネフィット (DCB、TTF > 400日) を得られた長期生存患者の全例を正確に識別することに成功した。

検証コホートにおける治療失敗リスクの有意な低下: 独立した2施設からなる統合検証コホート (n=67) に対し、機械学習モデルによる予測を適用した。RNA発現データと細胞型データの双方でベネフィットありと予測された「2モデル一致」群 (22例) は、非予測群 (45例) と比較して、主要エンドポイントであるTTF ITxが有意に延長し、その生存期間中央値の比較は 22 vs 45 patients において HR 0.46 (95% CI 0.23-0.92, p=0.035) と治療失敗リスクの有意な低下を示した (Figure 2A)。さらに、より厳格な基準である「4モデル全一致」群 (16例) においても、非予測群 (51例) に対しTTF ITxの顕著な延長が実証され、HR 0.40 (95% CI 0.17-0.94, p=0.033) を達成した。

PD-L1 IHCとの独立性と相補的予測能の証明: 本研究の極めて重要な知見として、機械学習モデルによる予測が、既存のPD-L1 IHC (TPS) による評価とは完全に独立した予測因子であることが示された。PD-L1陽性 (TPS 1%以上) かつ機械学習モデルが「ベネフィットあり」と予測した「両陽性群」は、最も良好なTTF ITxを示したのに対し、双方ともに陰性である「両陰性群」は極めて不良な経過をたどった (Figure 2B)。二変量Cox比例ハザードモデル解析の結果、PD-L1陽性 (HR 0.52, 95% CI 0.28-0.96, p=0.037) とMLモデル予測ベネフィット (HR 0.46, 95% CI 0.23-0.92, p=0.035) の双方が独立して有意な予測因子として維持され、両者が直交する相補的な情報を提供していることが統計学的に証明された (Figure 2C)。

遺伝子発現コンテキストの重要性の可視化: 構築されたSVMモデルの可視化解析により、個々の遺伝子の単独発現量ではなく、複数遺伝子の「コンテキスト (組み合わせ)」が予測において決定的な役割を果たしていることが明らかになった (Figure 3)。特定の1遺伝子の発現量のみを変化させ、他の遺伝子発現を一定に保った場合の予測確率の変化をシミュレーションしたところ、IL-18やZNF346は正の線形相関、F2RL1やIFI16は負の線形相関、IFITM1は逆比例、CAMPやCD1A、ELANEは飽和曲線など、各遺伝子で全く異なる応答パターンを示した (Figure 3A)。IFITM1やIL-18などの一部の遺伝子は単独でも予測確率に比較的大きな影響を与えたが、大部分の遺伝子は単独での影響が極めて限定的であり、全体のコンテキストに依存して初めて予測能を発揮した。また、細胞型データにおいても、CD8 T細胞やB細胞、好中球の存在量が、レスポンダーとノンレスポンダーのコンテキストによって異なる影響パターン (U字型曲線 vs 線形) を示し、微小環境のコンテキスト依存性が視覚的に実証された (Figure 3B)。

考察/結論

先行研究との違い: 従来の多くの研究では、単一の遺伝子や特定の細胞マーカーのみに焦点を当てた一変量解析による予測モデルが主流であった。これに対し、本研究は機械学習アルゴリズムを駆使して複数遺伝子の「発現コンテキスト」を包括的に捉えるモデルを構築した点で、これまでのアプローチと異なる。また、既報の18遺伝子腫瘍炎症シグネチャー (Ayers et al. JClinInvest 2017) などのシグネチャーが本研究コホートにおいて有意な予測能を示さなかったのとは対照的に、本研究で独自に同定された22遺伝子シグネチャーに基づくモデルは、独立した検証コホートにおいて治療失敗リスクの有意な低下を正確に予測した。

新規性: 本研究で初めて、機械学習モデルによる遺伝子発現コンテキストの予測情報が、臨床で標準的に用いられているPD-L1 IHC (TPS) とは完全に独立した「直交する」情報であることを多変量解析によって実証した。特に、PD-L1陽性 (TPS 1%以上) と判定された患者群の中から、実際にはICI治療の恩恵を受けられない「偽陽性」の患者を機械学習モデルによって正確に排除できることを示した点は極めて新規性が高い。また、モデルの可視化解析を通じて、個々の遺伝子発現量ではなく、複数遺伝子の相互作用からなる「コンテキスト」そのものが予測精度を担保していることを明確に示した点も、これまで報告されていない独創的な知見である。

臨床応用: 本研究で使用したNanoString nCounterプラットフォームは、日常臨床で得られる極めて微量かつ分解の進んだFFPE生検組織からでも高精度なRNA発現解析が可能であり、全自動システムによる迅速なターンアラウンドタイムで高度な診断が実現可能である。気管支鏡生検による小組織が診断の主流であるNSCLCの臨床現場において、この技術的適合性は極めて高い臨床的有用性を持つ。本モデルをPD-L1 IHCと組み合わせることで、ICI単剤療法の適応判断をさらに精緻化し、不必要な治療による副作用や医療コストの削減、および最適な個別化医療の提供に直結する。

残された課題: 本研究における最大の制限事項 (limitation) は、訓練コホート (n=55) および検証コホート (n=67) の症例数が比較的少数に留まっている点であり、より大規模な前向き臨床試験における外部検証が今後の検討課題である。また、両コホートにおいてTMBデータが利用できなかったため、本シグネチャーが予後因子ではなく真の治療効果予測因子であるかどうかの厳密な検証が不十分である。さらに、現在の一次治療の主流である化学免疫療法併用時の免疫コンテキストの変化に対する本モデルの予測能の維持については未解明であり、今後は化学免疫療法コホートにおけるモデルの再検証および最適化が必要である。

方法

患者選択とコホート構成: 本研究は、ドイツ国内の2つの胸部腫瘍センター (エッセン・ウエストドイツがんセンターおよびベルリン・Heckeshorn肺クリニック) において、PD-1/PD-L1標的抗体単剤療法 (ITx) を受けたStage IVまたは再発NSCLC患者を対象とした後向きコホート研究 (retrospective cohort study) である。ITx開始前に実施された最終診断時の生検FFPE組織からRNAを抽出した。主要エンドポイント (primary endpoint) は、ITx治療失敗までの期間 (TTF ITx) およびRECIST基準に基づく最良奏効 (best RECIST response) とした。

訓練コホートは、エッセン施設でスクリーニングされた127例のうち、十分なRNA品質が得られ、かつnCounterによる解析基準を満たした55例で構成された。患者背景は、男性 60.0% (33例)、腺癌 60.0% (33例)、扁平上皮癌/NOS 40.0% (22例) であり、前治療ライン数は1ラインが 60.0% (33例)、2ラインが 25.5% (14例)、3ライン以上が 14.5% (8例) であった。PD-L1 IHC TPSは、陰性 (<1%) が 38.2% (21例)、1-49%が 36.4% (20例)、50%以上が 14.5% (8例) であった。

モデル構築後、エッセン施設から新たに募集した第1検証コホート (n=36) と、独立したベルリン施設から募集した第2検証コホート (n=31、扁平上皮癌 54.8%を含む) の計67例を統合検証コホートとして使用した。

RNA発現解析と細胞型データへの変換: FFPE組織から抽出したRNAを用い、NanoString nCounter PanCancer Immune Profiling panelを用いて770遺伝子の発現カウントを取得した。さらに、既報の免疫細胞特異的遺伝子セット (Rooney et al. Cell 2015、Becht et al) を用いて、770遺伝子の発現データを免疫細胞型別相対存在量を示す「細胞型データ」へと変換した。これにより、「RNA発現データ」と「細胞型データ」の2つの入力データセットを用意した。

機械学習アルゴリズムと統計解析: 訓練コホート (n=55) において、特徴量選択とモデル構築を実施した。特徴量選択には、アンサンブルサブサンプリングアプローチを組み合わせたLasso回帰 (Python scikit-learn実装) を用い、アウトカムをランダム化したデータとの比較から有意な遺伝子群を抽出した。モデル構築では、RNA発現データおよび細胞型データのそれぞれに対し、サポートベクターマシン (SVM: support vector machine) や決定木などの複数のアルゴリズムを評価した。連続変数としてのTTF予測は根平均二乗誤差が大きく精度が不良であったため、最良奏効 (best response) を2カテゴリまたは3カテゴリに分類するカテゴリアウトカムモデルを採用した。

最終的に、2つのデータソース (RNA発現、細胞型) と2つの分類アウトカム (2カテゴリ、3カテゴリ) の組み合わせから計4つの予測モデルを構築した。検証コホートにおいては、これら4モデルのうち「2つのモデルがベネフィットありと予測 (2モデル一致)」または「4つのモデルすべてがベネフィットありと予測 (4モデル全一致)」する論理積アプローチを用いて評価した。生存時間解析にはKaplan-Meier法およびCox比例ハザード回帰モデル (Cox proportional hazards regression model) を用いた。

Research Wiki

エクスプローラー

Machine learning reveals a PD-L1-independent prediction of response to immunotherapy of non-small cell lung cancer by gene expression context

背景

目的

結果

考察/結論

方法

グラフビュー

目次

バックリンク