• 著者: Shukuya T, Carbone DP
  • Corresponding author: David P. Carbone, MD, PhD (Ohio State University Comprehensive Cancer Center, Columbus, OH, USA)
  • 雑誌: Journal of Thoracic Oncology
  • 発行年: 2016
  • Epub日: 2016-03-01
  • Article種別: Review
  • PMID: 26944305

背景

2012年から2015年にかけて、抗PD-1抗体 (ニボルマブ、ペムブロリズマブ) および抗PD-L1抗体 (アテゾリズマブ、デュルバルマブ、アベルマブ) の非小細胞肺癌 (NSCLC) を対象とした第1相から第3相試験が相次いで報告され、NSCLCの治療パラダイムは大きく変化しつつあった。特に、Brahmer et al. NEnglJMed 2015Borghaei et al. NEnglJMed 2015が報告したCheckMate 017および057試験ではニボルマブがドセタキセルに対して全生存期間 (OS) の優越性を示し、Garon et al. NEnglJMed 2015が報告したKEYNOTE-001試験ではペムブロリズマブがPD-L1腫瘍細胞比率 (TPS) 50%以上の患者で高い有効性を示すことが報告された。しかし、免疫チェックポイント阻害薬 (ICB) 全体での奏効率 (ORR) は13.6%から23%程度に留まり、大多数の患者がこの治療の恩恵を受けられない状況であった。このため、治療効果を予測し、適切な患者を選択するためのバイオマーカーの確立が喫緊の課題として認識されていた。

PD-L1免疫組織化学 (IHC) は最も有望なバイオマーカーとして検討されてきたが、いくつかの重要な課題が存在した。第一に、各薬剤開発企業が独自の抗体クローン (28-8、22C3、SP142、SP263など)、スコアリング方法 (腫瘍細胞比率TPS vs 免疫細胞比率IC)、およびカットオフ値を採用しており、試験間の結果比較や臨床現場での標準化が極めて困難であった。例えば、PD-L1発現の評価は、腫瘍細胞膜の染色強度や割合だけでなく、腫瘍浸潤免疫細胞 (IC) の染色も考慮に入れる必要があり、その評価基準はアッセイ間で大きく異なっていた。第二に、PD-L1発現は時間経過や先行治療 (EGFR-TKI、ALK-TKI、放射線治療など) によって変動する可能性が指摘されており、単一時点での生検検体による評価の限界も問題となっていた。これらの変動性は、PD-L1が理想的な予測バイオマーカーとして機能するための信頼性を低下させる要因であった。このように、PD-L1 IHCの測定技術、抗体クローン、カットオフ値の標準化が未確立であるという課題が残されていた。

PD-L1 IHC以外にも、応答する患者を予測するバイオマーカーとして、腫瘍変異負荷 (TMB)、マイクロサテライト不安定性 (MSI)、インターフェロンγ (IFN-γ) シグネチャー、特定の遺伝子変異 (EGFR/KRAS変異ステータス)、さらには腸内細菌叢などが検討され始めていた。しかし、これらのバイオマーカーはまだ探索段階にあり、その予測能、限界、およびPD-L1との相互関係について包括的な整理と検証が必要とされていた。特に、TMBは高変異負荷の腫瘍でネオアンチゲンが多く生成され、T細胞応答を誘導しやすいという仮説に基づき注目されていたが、その測定方法やカットオフ値の標準化は未解明な点が多かった。また、EGFR変異陽性NSCLC患者における免疫チェックポイント阻害薬の有効性が低い可能性も示唆されており、これらの患者群に対する治療戦略も課題として残されていた。本レビューは、これらの複雑な状況下で、2015年末までの既存データを包括的に評価し、NSCLCにおける抗PD-1/PD-L1抗体の有効性を予測するバイオマーカーの現状と今後の課題を明確にすることを目的とした。

目的

本レビューの目的は、2012年1月から2015年12月までに報告された肺がんを対象とした抗PD-1/PD-L1抗体試験データを包括的に収集し、その有効性予測バイオマーカー (PD-L1発現、腫瘍変異負荷 (TMB)、IFN-γシグネチャー、マイクロサテライト不安定性 (MSI)、腸内細菌叢など) の現状と限界を詳細に論じることであった。特に、PD-L1免疫組織化学 (IHC) におけるアッセイ間の差異、カットオフ値の不均一性、および腫瘍組織におけるPD-L1発現の異質性や経時的変化の臨床的意義を明確にすることを重視した。さらに、PD-L1以外の新たなバイオマーカー候補の探索的データも評価し、これらのバイオマーカーが単独または組み合わせで、非小細胞肺癌 (NSCLC) 患者の治療選択にどのように貢献しうるかを考察することも目的とした。最終的に、今後の臨床試験デザインや実臨床におけるバイオマーカー戦略の方向性を示すことを目指した。

結果

PD-L1 IHCの技術的課題と測定信頼性: PD-L1免疫組織化学 (IHC) は、測定技術、抗体クローン、および組織検体間で一定の不一致が報告されている。80例のStage II NSCLC手術検体を用いた比較では、28-8抗体で34%、SP142で36%、E1L3Nで24%の陽性率 (カットオフ1%) を示し、3抗体間の一致率は76% (61/80例) に留まった。定量的蛍光免疫染色を用いた別の研究では、SP142とE1L3Nのコーエンk値が0.124〜0.340と低い (poor concordance) ことが示され、アッセイ内変動係数も大きかった (SP142: 12.17〜109.61%、E1L3N: 6.75〜75.24%)。原発巣と転移巣間の一致率は63〜100% (カットオフ値依存) であり、治療経過中のPD-L1状態変化は症例の12〜35%で認められた (EGFR-TKI・ALK-TKI前後の22〜25%で変動)。これらの測定上の不安定性は、PD-L1が「理想的なバイオマーカー」の条件を満たしにくいことを示す重要な背景情報であった。IASLC主導の多施設比較試験 (各アッセイを大規模コホートで免疫療法アウトカムと照合する研究) が進行中であった (Table 1参照)。

PD-L1 IHCの予後因子としての不確実性: PD-L1は免疫療法の予測因子としての検討に先立ち、予後因子としての解析が行われてきた。6試験1,157例のメタ解析ではPD-L1高発現とOS不良の相関が示されたが、22C3抗体を用いた678例 (Stage I-III) の解析では逆に高発現 (TPS≥50%) がOS良好と相関した。また、Stage III化学放射線療法 (CRT) 患者n=50例 (E1L3N) ではPD-L1陽性がOS・PFS不良と相関するなど、結果は矛盾していた。このように予後マーカーとしての位置付けすら確立されていない状況下での予測マーカー評価は限界を持つことが示唆された。

ニボルマブのPD-L1予測能:扁平上皮癌と非扁平上皮癌での乖離: Brahmer et al. NEnglJMed 2015が報告したCheckMate 017試験 (扁平上皮NSCLC、2次治療、ニボルマブ vs ドセタキセル、n=272) では、ニボルマブ群がOS HR=0.59 (95% CI 0.44-0.79, p<0.001)、PFS HR=0.62 (95% CI 0.47-0.81, p<0.001)、ORR 20% vs 9% (p=0.008) と有意に優越した。しかし、PD-L1発現 (28-8抗体、TPS 1%/5%/10%カットオフ) はOS、PFS、ORRのいずれとも有意な相関を示さなかった。PD-L1 1%以上の患者も1%未満の患者も同様にニボルマブから利益を受けており、扁平上皮癌においてPD-L1は予測バイオマーカーとして機能不全であることが明確に示された (Table 2)。 一方、Borghaei et al. NEnglJMed 2015が報告したCheckMate 057試験 (非扁平上皮NSCLC、2次治療、ニボルマブ vs ドセタキセル、n=582) では、ニボルマブ群がOS HR=0.73 (95% CI 0.59-0.89, p=0.002)、ORR 19% vs 12% (p=0.02) と有意に優越した。PFS中央値はニボルマブ群2.3ヶ月 vs ドセタキセル群4.2ヶ月とKaplan-Meier曲線がcrossoverする結果であった (PFS HR=0.92, p=0.39)。PD-L1発現 (28-8抗体) との相関は、TPS 1%/5%/10%のすべてのカットオフでニボルマブの利益が増大する強い予測関連を示した (例:TPS≥10%でOS HR=0.40、TPS<1%でOS HR=0.90と利益が消失に近い)。すなわち非扁平上皮癌ではPD-L1がニボルマブの有効な予測バイオマーカーであった (Table 2)。この扁平上皮癌と非扁平上皮癌での乖離は当時の大きな謎であり、扁平上皮癌のPD-L1陰性であっても有効な理由として喫煙による変異負荷や炎症性腫瘍微小環境などが仮説として挙げられた。

ペムブロリズマブのPD-L1予測能:22C3アッセイとTPS≥50%カットオフの確立: Garon et al. NEnglJMed 2015が報告したKEYNOTE-001試験 (第1相、NSCLC、治療ライン不問、ペムブロリズマブ、n=495) では、22C3抗体によるTPSと臨床効果の相関をROC解析で検討し、TPS≥50%が最適カットオフとして同定された。PD-L1 TPS<1%でORR 10.7%、mPFS 4.0ヶ月、mOS 10.4ヶ月であったのに対し、TPS 1〜49%でORR 16.5%、mPFS 4.1ヶ月、mOS 10.6ヶ月、そしてTPS≥50%でORR 45.2%、mPFS 6.3ヶ月、mOS未到達という段階的な用量反応パターンが示された。TPS≥50%でのORR 45.2%という高い奏効率に基づき、ペムブロリズマブは「TPS≥50% NSCLC」として承認される根拠となった (Table 2)。 Herbst et al. Lancet 2016が報告したKEYNOTE-010試験 (第2/3相、2次治療以降、PD-L1陽性[TPS≥1%]NSCLC、ペムブロリズマブ 2mg/kg vs 10mg/kg vs ドセタキセル、n=1,034) では、2mg/kg群でOS HR=0.71 (95% CI 0.58-0.88, p=0.0008)、10mg/kg群でOS HR=0.61 (95% CI 0.49-0.75, p<0.0001) と両用量群でドセタキセルに対してOS優越性が示された。ORRも2mg/kg群18%、10mg/kg群18% vs ドセタキセル群9% (p<0.001) と有意に高かった。PFS差は2mg/kg群で有意差なし (HR=0.88, p=0.07) であったが、10mg/kg群で有意差が認められた (HR=0.79, 95% CI 0.66-0.94, p=0.004)。TPS≥50%サブセットでは利益がさらに大きく (2mg/kg: OS HR=0.54、10mg/kg: OS HR=0.50)、高用量ペムブロリズマブとドセタキセルの毒性比較 (Grade 3〜5治療関連有害事象: ペムブロリズマブ13〜16% vs ドセタキセル35%) も重要な知見であった (Table 2)。

アテゾリズマブのPD-L1予測能:腫瘍細胞/免疫細胞 (TC/IC) スコアリング: アテゾリズマブは、ニボルマブやペムブロリズマブとは異なり、SP142抗体を用いて腫瘍細胞 (TC) と浸潤免疫細胞 (IC) の2つのコンパートメントでPD-L1発現を別々に評価するTC/ICスコアリングシステムを採用した。Herbst et al. Nature 2014が報告した第1相試験 (n=88) の初期報告ではIC発現との相関 (p=0.015) が示され、TC発現との相関は認められなかったが (p=0.920)、更新報告でTC3の定義がPD-L1陽性TC≥10%から≥50%に変更され、TC3またはIC3 (≥10%) 患者でORR 48%という高い奏効率が示された (Table 2)。 POPLAR試験 (第2相無作為化、2/3次治療、アテゾリズマブ vs ドセタキセル、n=287) では、アテゾリズマブ群がOS HR=0.73 (95% CI 0.53-0.99, p=0.040) と有意に優越した。TC/ICスコアが高いほど利益が大きく (TC0/IC0でHR=1.04、TC3/IC3でHR=0.49)、TCsとICs両方が独立してOS改善と相関することが示された (Table 2)。FIR試験 (PD-L1選択、TC2-3またはIC2-3、第2相、3コホート) では、1次治療コホートでmPFS 4.5ヶ月、ORR 26% (TC3/IC3でORR 29%)、2次治療 (脳転移なし) でmOS 10.6ヶ月、ORR 16% (TC3/IC3でORR 24%)、2次治療 (脳転移治療済み) でmOS 6.8ヶ月、ORR 23%であった (Table 2)。BIRCH試験 (PD-L1選択、TC2-3またはIC2-3、第2相、3コホート) では、1次治療コホートORR 19% (TC3/IC3で26%)、12ヶ月OS率82%、2次治療ORR 17% (TC3/IC3で24%)、12ヶ月OS率76%、3次治療以降ORR 17% (TC3/IC3で27%)、12ヶ月OS率71%と、治療ラインが遅くなるにつれて数値が低下する傾向が認められた (Table 2)。

アベルマブ・デュルバルマブの初期データ: アベルマブ (第1b相、2次治療以降、n=184) では、ORR 13.6%、mPFS 11.6週、mOS 8.4ヶ月であった。PD-L1陽性 (TPS≥1%) 患者では陰性患者よりも高いORR、長いPFS、長いOSが認められた (例:PD-L1<1%でmOS 4.6ヶ月) (Table 2)。デュルバルマブ (第1/2相、2次治療以降、n=200) では、ORR 16%であった。SP263抗体でTPS≥25%陽性患者ではORR 27% vs <25%で5%という明確な差が示された (Table 2)。

小細胞肺癌 (SCLC) のPD-L1予測能: CheckMate 032試験 (ニボルマブ±イピリムマブ、再発SCLC) では、ニボルマブ単独ORR 18%、ニボルマブ+イピリムマブORR 17%であり、PD-L1発現にかかわらず奏効が認められた (non-predictive)。KEYNOTE-028試験 (ペムブロリズマブ、PD-L1≥1%選択再発SCLC、n=24) では、ORR 29.2%、mPFS 1.8ヶ月であった。PD-L1発現比率と奏効の明確な相関は認められず、SCLCではバイアブルな組織が少なく評価可能例が限られた。SCLCではPD-L1予測能はNSCLCと異なる可能性が示唆された。

腫瘍変異負荷 (TMB) ・非同義変異の予測能: Rizvi et al. Science 2015は、ニボルマブ/BMS-936559に奏効したNSCLC患者の全エクソーム解析 (WES) を実施し、「高非同義変異負荷 (>209変異/中央値より上) 」が奏効と相関することを初めて報告した。discovery cohort (n=16) では高変異負荷群vs低変異負荷群でORR 63% vs 0% (Fisher’s exact p=0.03)、mPFS 14.5 vs 3.7ヶ月 (HR=0.19, 95% CI 0.05-0.70) と劇的な差が認められた。validation cohort (n=18) では高変異負荷 (>200変異) vs低変異負荷でORR 56% vs 22% (p=0.33で有意差なし) であったが、mPFSは有意に長く (中央値未到達 vs 3.4ヶ月、HR=0.15, 95% CI 0.04-0.59)、DNA修復変異や喫煙関連変異シグネチャーも奏効と相関した。TMBとPD-L1は独立した予測因子であることが初期データで示唆された。FoundationOneなどのパネル検査によるTMBの実臨床評価の課題 (全エクソーム vs パネル間の相関、カットオフ設定、コストなど) も議論された。

MSI-H (高頻度マイクロサテライト不安定性) の可能性: Le et al. NEnglJMed 2015が大腸がんにおけるニボルマブ第2相試験 (n=41) で報告したところによると、ミスマッチ修復 (MMR) 欠損腫瘍で免疫関連奏効率 (RR)、PFS、OSが有意に優越した。WES解析では、MMR欠損腫瘍の平均体細胞変異数1,782 vs MMR正常73 (p=0.007) と約24倍の差が認められた。この知見は「高変異負荷→多量のネオアンチゲン→T細胞活性化→ICI奏効」という機序を支持し、MSI-H/dMMRが腫瘍種横断的なICI予測バイオマーカーとなる可能性を提示した。肺がんへの直接外挿は当時推測的だったが、その後の研究でNSCLCのdMMRも奏効と相関することが確認された。

KRASおよびEGFR変異との相関: KRAS変異は喫煙と強く相関し (非喫煙者でのEGFR変異と逆相関)、喫煙関連高変異負荷とも関連する。CheckMate 057のサブグループ解析で、EGFR変異型 (n=82) ではニボルマブのOS HR=1.18 (不利)、KRAS変異型 (n=62) ではOS HR=0.52 (大きな利益)、EGFR野生型ではOS HR=0.66であった。KEYNOTE-010のEGFR変異型ではペムブロリズマブのOS HR=0.88 (利益限定的) vs EGFR野生型HR=0.66であった。これらのデータはEGFR変異NSCLCにおけるICIの限界を示す重要な先行知見であったが、他の試験では独立したEGFR/KRAS変異とICIレスポンスの相関は一貫しなかった (CheckMate 003など) (Table 3)。

その他のバイオマーカー (IFN-γシグネチャー・PD-L2・CD8+ TIL): IFN-γ遺伝子シグネチャー:デュルバルマブ第1/2相試験では、Fluidigm Biomark (100種免疫関連遺伝子) 解析でIFN-γ発現が最も奏効と相関した (IFN-γ陽性ORR 33% vs 陰性8%)。IFN-γ陽性かつPD-L1陽性患者でORR 46%と最高 (二重陽性の相加効果) であった。IFN-γシグネチャー10遺伝子はペムブロリズマブ (KEYNOTE-001のメラノーマコホート) での奏効・PFSとも相関した (p=0.047・p=0.016)。一方、NSCLCではメラノーマより相関が弱かった。PD-L2:PD-L1と有意に相関 (発現分布・mRNA定量ともp<0.0001) するが、頭頸部扁平上皮癌でのペムブロリズマブ (n=144) のpre-clinical解析でPD-L2発現がPFS改善 (p=0.031) と相関し、PD-L1と独立した予測因子の可能性が示唆された。B7-H3、LAG3、TIM3、CTLA-4、IDO1などの他の免疫抑制遺伝子はアテゾリズマブ第1相試験での発現解析でICIとの相関が認められなかった。腸内細菌叢については初期のメラノーマデータのみ (肺がんデータなし) で当時は推測的であった。

考察/結論

本レビューは、2015年時点の抗PD-1/PD-L1抗体試験データを包括的に整理し、以下の重要な結論を導いた。

先行研究との違い: 本レビューは、PD-L1免疫組織化学 (IHC) の予測能が、腫瘍組織型 (扁平上皮癌 vs 非扁平上皮癌) および使用される抗体クローン (28-8 vs 22C3 vs SP142) によって大きく異なることを明確に示した点で、これまでの個別報告とは異なる包括的な視点を提供した。特に、ニボルマブにおける扁平上皮癌でのPD-L1非予測能と非扁平上皮癌での強い予測能の乖離は、当時の臨床現場における大きな課題であり、本レビューはこの複雑な状況を整理した。また、アテゾリズマブが腫瘍細胞 (TC) と免疫細胞 (IC) の両方でPD-L1発現を評価する独自のスコアリングシステムを採用している点も、他の薬剤との対照的な特徴として強調された。

新規性: 本研究は、PD-L1発現だけでなく、腫瘍変異負荷 (TMB) が抗PD-1/PD-L1抗体の有効性を予測する独立したバイオマーカーとして有望であることを、Rizvi et al. Science 2015のデータを引用し、本研究で初めて包括的に提唱した。高変異負荷の腫瘍ではネオアンチゲンが多く生成され、T細胞応答を誘導しやすいというメカニズムに基づき、TMBがPD-L1陰性患者における奏効を説明しうる可能性を指摘した点は新規性が高い。さらに、マイクロサテライト不安定性 (MSI-H) が大腸がんにおいて免疫チェックポイント阻害薬に高い奏効を示すというLe et al. NEnglJMed 2015の知見を肺がんに外挿し、腫瘍種横断的なバイオマーカーとしての可能性を早期に示唆したことも、本レビューの重要な貢献である。

臨床応用: 本知見は、非小細胞肺癌患者に対する免疫チェックポイント阻害薬の臨床応用において、より個別化された治療戦略を構築するための基盤を提供する。特に、ペムブロリズマブにおいてはPD-L1 TPS≥50%が最も確立された予測バイオマーカーであり、このカットオフ値が実臨床での患者選択に直結する。しかし、PD-L1陰性患者でも奏効例が存在することから、PD-L1発現のみで患者を除外することの不適切性も指摘された。TMBやMSI-Hなどの補完的なバイオマーカーを組み合わせることで、PD-L1陰性患者の中から真に利益を得る患者を特定し、治療機会を最大化する臨床的意義が示唆された。また、EGFRドライバー変異陽性NSCLC患者における免疫チェックポイント阻害薬の限界 (HR≥1.0) を早期に指摘したことも、その後の臨床現場での治療選択に大きな影響を与えた。

残された課題: 今後の検討課題として、PD-L1 IHCの測定技術、抗体クローン、およびカットオフ値の標準化が緊急に必要である。異なるアッセイ間での結果の不一致や、腫瘍内・腫瘍間の異質性、さらには先行治療によるPD-L1発現の変化は、PD-L1を理想的なバイオマーカーとする上での大きなlimitationである。また、TMBの測定方法 (全エクソームシーケンス vs パネルシーケンス) の標準化、最適なカットオフ値の設定、および実臨床でのコスト効率の良い検査法の開発も残された課題である。IFN-γシグネチャーや腸内細菌叢などの探索的バイオマーマーについては、さらなる前向き検証が必要である。複数のバイオマーカーを組み合わせた複合的な予測モデルの構築や、治療前後のバイオマーカー変化を評価する動的なアプローチも、今後の研究の方向性として重要である。

方法

本レビューでは、2012年1月から2015年12月までの期間に報告された研究を対象に文献検索を実施した。主要な情報源として、PubMedデータベースおよび米国臨床腫瘍学会 (ASCO)、欧州臨床腫瘍学会 (ESMO)、国際肺癌学会 (IASLC) の学術集会抄録を用いた。

PubMedデータベースでの検索には、「lung cancer AND PD-1」または「lung cancer AND PD-L1」というキーワードを組み合わせて使用した。これにより、肺がんにおけるPD-1/PD-L1経路に関連する研究論文を網羅的に抽出した。学術集会抄録については、上記の期間に開催されたASCO、ESMO、IASLCの会議で発表された抄録のタイトルおよび要旨を精査し、抗PD-1/PD-L1抗体の有効性予測バイオマーカーに関連する研究を特定した。

抽出された文献は、主に非小細胞肺癌 (NSCLC) を対象とした抗PD-1/PD-L1抗体の臨床試験 (第1相から第3相) のデータ、およびこれらの薬剤の有効性予測因子に関する基礎研究やトランスレーショナル研究の報告に焦点を当ててレビューされた。特に、PD-L1免疫組織化学 (IHC) の技術的側面、異なる抗体クローン (28-8、22C3、SP142、SP263など) とその評価基準、PD-L1発現の腫瘍細胞 (TC) と免疫細胞 (IC) における評価方法、カットオフ値の設定、およびPD-L1発現の異質性や先行治療による変化に関するデータが詳細に分析された。TC (tumor cell) とIC (immune cell) の両コンパートメントにおけるPD-L1発現評価は、アテゾリズマブの臨床試験で特に重要視された評価方法である。

また、腫瘍変異負荷 (TMB)、マイクロサテライト不安定性 (MSI)、インターフェロンγ (IFN-γ) シグネチャー、特定の遺伝子変異 (EGFR、KRAS、ALKなど)、およびその他の免疫関連遺伝子発現パターンといった、PD-L1以外のバイオマーカー候補に関するデータも収集・評価された。これらのバイオマーカーの予測能、臨床的意義、およびPD-L1との相関関係について、各試験の奏効率 (ORR)、無増悪生存期間 (PFS)、全生存期間 (OS) などの臨床アウトカムとの関連性が検討された。統計解析手法としては、各臨床試験で用いられたハザード比 (HR) やp値、信頼区間 (CI) などの報告値が引用された。例えば、ROC解析を用いたカットオフ値の最適化や、Fisher’s exact testによる群間比較などが報告されている。本レビューでは、これらの既存の統計解析結果を統合的に評価し、バイオマーカーの予測能の信頼性を判断した。本レビューでは、特定のエビデンスレベルの評価システム(例: GRADE)は採用せず、各研究の報告内容を直接的に引用・統合する形式をとった。