• 著者: Ratcliffe MJ, Sharpe A, Midha A, Barker C, Scott M, Scorer P, Al-Masri H, Rebelatto MC, Walker J
  • Corresponding author: Marianne J. Ratcliffe (AstraZeneca, Alderley Park, UK)
  • 雑誌: Clinical Cancer Research
  • 発行年: 2017
  • Epub日: 2017-01-10
  • Article種別: Original Article
  • PMID: 28073845

背景

PD-1 (Programmed Cell Death 1)/PD-L1 (Programmed Cell Death Ligand-1) 免疫チェックポイント阻害薬の臨床応用において、腫瘍の PD-L1 発現レベルは治療選択の重要なバイオマーカーである。腫瘍は PD-L1 を発現することで T 細胞の抗腫瘍免疫応答を抑制し、免疫系からの認識を回避することが知られている (Dong et al. NatMed 2002)。この PD-1/PD-L1 経路の阻害は、複数の腫瘍種、特に非小細胞肺癌 (NSCLC) において、有望な抗腫瘍活性と管理可能な忍容性を示すことが報告されている (Pardoll et al. NatRevCancer 2012, Postow et al. JClinOncol 2015)。

抗 PD-1 抗体であるペムブロリズマブは、転移性 NSCLC の治療において、PD-L1 腫瘍比例スコア (TPS: Tumor Proportion Score) が 50% 以上の患者に対する第一選択薬として、FDA (Food and Drug Administration) 承認のコンパニオン診断薬 Dako PD-L1 IHC (Immunohistochemistry) 22C3 pharmDx を用いた検査結果に基づき承認された (Garon et al. NEnglJMed 2015)。その後、PD-L1 TPS が 1% 以上の患者にも適応が拡大されている (Herbst et al. Lancet 2016)。ニボルマブは NSCLC において PD-L1 検査が必須ではないものの、Dako PD-L1 IHC 28-8 pharmDx が補完的診断薬として FDA 承認を取得している (Borghaei et al. NEnglJMed 2015)。さらに、抗 PD-L1 抗体であるアテゾリズマブも、プラチナ製剤を含む化学療法後に進行した転移性 NSCLC 患者に対して FDA 承認を受けており、VENTANA PD-L1 (SP142) アッセイが補完的診断薬として用いられている (Fehrenbacher et al. Lancet 2016)。

しかし、各薬剤の承認はそれぞれ異なる抗体クローン、IHC プロトコル、スコアリングアルゴリズム、およびカットオフ値を用いる個別の診断アッセイに基づく臨床試験データに依存している。例えば、ペムブロリズマブの承認根拠である Dako 22C3 の 50% カットオフは Dako 28-8 では検証されておらず、アッセイ間の代替使用の可否は未確立であった。複数の IHC プラットフォームを維持することは施設にとって非効率であり、異なるアッセイ間での薬剤と無関係なクロスマッチは患者に不利益をもたらすリスクがある。また、PD-L1 発現は連続変数として分布し、腫瘍内不均一性も生じうるため、単純な陽性/陰性二値化では臨床的柔軟性が失われる可能性が指摘されている。一部の施設では、独自のプロトコルで開発された LDT (laboratory-developed tests) を使用している場合もあり、アッセイ間の標準化の必要性が高まっている。このような状況において、PD-L1 アッセイの技術的同等性を検証するための大規模な研究が不足しており、アッセイ間のハーモナイゼーションに向けたエビデンスの構築が課題として残されていた。

目的

本研究は、NSCLC における 3 種類の市販 PD-L1 IHC 診断アッセイ — Ventana SP263 (デュルバルマブ用)、Dako 22C3 (ペムブロリズマブ用)、Dako 28-8 (ニボルマブ用) — の腫瘍膜染色に関する解析的一致率を、臨床的に意義ある複数のカットオフ値 (1%, 10%, 25%, 50%) で大規模に検証することを目的とする。これにより、これらのアッセイが互換的に使用可能であるか、また PD-L1 免疫療法の治療選択におけるハーモナイゼーションの可能性を探ることを目指した。

結果

PD-L1腫瘍膜染色パターンと発現率の連続分布: 500 例中 7 例がサンプル品質基準を満たさず、最終解析対象は 493 例であった。患者背景はステージ I〜IV の NSCLC であり、約 75.3% が白人、扁平上皮癌と非扁平上皮癌がそれぞれ約 50% を占めた。サンプル年齢は切除から 1〜4 年の範囲であった。3 アッセイはいずれも腫瘍細胞膜染色において類似したパターンを示した (Figure 1)。PD-L1 陽性腫瘍細胞の割合は 3 アッセイいずれでも 0%〜100% の連続した分布を示し (Figure 3)、腫瘍によって 0% から高発現まで幅広いスペクトルが認められた。各 2 アッセイ間のスピアマン相関係数はすべて > 0.9 であり (Figure 2)、腫瘍膜染色率において極めて高い相関が確認された。Ventana SP263 は解析プロトコル上 25% 以上の染色について最初に設計されていたため、1%・5%・10% カットオフでの追加スコアリングをウォッシュアウト後に別途実施し、Dako 22C3 および Dako 28-8 との直接比較を可能とした。

複数のPD-L1発現カットオフ値におけるアッセイ間の高い全体一致率: 複数カットオフ値における OPA は以下の通りであった (Table 1)。1% カットオフでは、SP263 vs 28-8 で 91.7% (95% CI 89.3%)、22C3 vs 28-8 で 93.7% (95% CI 91.7%)、SP263 vs 22C3 で 91.1% (95% CI 88.7%) であった。10% カットオフでは、SP263 vs 28-8 で 92.9% (95% CI 90.7%)、22C3 vs 28-8 で 94.9% (95% CI 93.0%)、SP263 vs 22C3 で 92.7% (95% CI 90.5%) を示した。25% カットオフでは、SP263 vs 28-8 で 94.9% (95% CI 93.0%)、22C3 vs 28-8 で 96.6% (95% CI 94.9%)、SP263 vs 22C3 で 94.3% (95% CI 92.3%) であった。最も高い 50% カットオフでは、SP263 vs 28-8 で 95.9% (95% CI 94.2%)、22C3 vs 28-8 で 97.2% (95% CI 95.6%)、SP263 vs 22C3 で 93.5% (95% CI 91.4%) となった。OPA の範囲は全体で 91.1%〜97.2% であり、IHC の標準的な同一アッセイ内一致率基準 (OPA > 90%) を全ペア・全カットオフで達成した。カットオフ値が高くなるほど OPA が向上する傾向が認められ、50% カットオフでの一致率が最も高かった。これは高発現例の判定では低発現例での微妙なスコアリング差異の影響が小さくなるためと解釈される。なお、Dako 22C3 vs Dako 28-8 ペアが Ventana SP263 を含む比較よりも一致率が高い傾向があったが、これは 22C3 と 28-8 が同じ Dako プラットフォーム (Autostainer Link 48) を使用することに由来する可能性がある。

臨床的に関連するカットオフ値における陽性・陰性一致率: 臨床的関連カットオフ値 (Dako 28-8 の 1%・10%、Ventana SP263 の 25%、Dako 22C3 の 50% を各リファレンスアッセイとした比較) での PPA は 86.0%〜97.5%、NPA は 93.5%〜98.8% の範囲であった (Table 2)。NPA は PPA よりも安定して高く、低発現例の識別においても高い一致率が維持された。特に、Dako 22C3 50% カットオフをリファレンスとした場合、Dako 28-8 の PPA は 97.5% (95% CI 93.7%)、NPA は 97.0% (95% CI 95.2%) と極めて高い一致率を示した。この結果は、異なるアッセイ間でも臨床的に重要なカットオフ値において高い互換性があることを強く示唆する。Dako 28-8 の 10% カットオフをリファレンスとした場合、Ventana SP263 との PPA は 91.4% (95% CI 87.6%)、NPA は 94.0% (95% CI 91.1%) であった。Dako 22C3 との PPA は 94.8% (95% CI 91.5%)、NPA は 95.1% (95% CI 92.4%) であった。これらの結果は、CheckMate 057 試験でニボルマブが PD-L1 発現 < 10% の NSCLC 患者においてドセタキセルに対する有意な有効性を示さなかったという知見を考慮すると、10% カットオフの臨床的意義を裏付けるものである。

低カットオフにおける観察者間一致率の低下: 200 例のサブセットにおける独立病理医との観察者間 OPA は、10%・25%・50% カットオフで > 85% であったが、1% カットオフでは 75.9%〜77.0% と相対的に低下した (Table 3)。Ventana SP263 の 1% カットオフでの観察者間 OPA は 75.9% (95% CI 70.4%) であった。Dako 22C3 の 1% カットオフでは 76.5% (95% CI 71.0%)、Dako 28-8 の 1% カットオフでは 77.0% (95% CI 71.6%) であった。これは低カットオフでの判定において読者間変動がアッセイ変動を上回ることを示唆する。すなわち、3 アッセイ自体の解析的変動は観察者間変動より小さく、アッセイの互換性に関する結論を支持するものである。この知見は、PD-L1 検査の標準化において、アッセイの選択だけでなく病理医のトレーニングが特に低発現域での判定精度に大きく影響することを示唆している。

考察/結論

本研究は NSCLC における PD-L1 IHC アッセイ比較研究としてそれまでで最大規模であり (493 例の患者サンプル)、AstraZeneca・Bristol-Myers Squibb・Merck Sharp & Dohme が用いる 3 種の市販アッセイ間の高い解析的同等性を実証した。3 アッセイは抗体クローンが異なるにもかかわらず腫瘍膜染色において高い相関と一致率を示したことは、PD-L1 アッセイのハーモナイゼーションが現実的である可能性を強く示唆する。

新規性: 本研究で初めて、大規模な患者コホート (n=493 patients) を用いて、Ventana SP263、Dako 22C3、Dako 28-8 の 3 種 PD-L1 IHC アッセイが複数の臨床的に関連するカットオフ値 (1%, 10%, 25%, 50%) において一貫して 90% を超える全体一致率を達成することを新規に示した。これは、アッセイ自体の変動が病理医間の観察者間変動よりも小さいという重要な知見を伴うものであり、これまでの小規模な研究では十分に評価されていなかった点である。特に、PD-L1 発現が連続変数として分布し、腫瘍内不均一性が存在する中で、これらのアッセイが安定した結果を提供できることを示した点は、今後の臨床的応用において重要な基盤となる。

先行研究との違い: 以前の IASLC (International Association for the Study of Lung Cancer) と AACR (American Association for Cancer Research) による Blueprint プロジェクト Phase I では、Ventana SP142 が腫瘍細胞染色において他 3 アッセイより有意に少ない細胞を標識することが示されており、本研究の対象アッセイとは対照的な挙動を示すことが報告されている。本研究は SP142 を評価対象に含んでいない点に注意が必要である。また、McLaughlin et al. JAMAOncol 2016 が PD-L1 発現の不均一性を定量的に評価したのに対し、本研究はアッセイ間の解析的同等性に焦点を当てた。本研究の結果は、異なる抗体クローンを使用しているにもかかわらず、22C3、28-8、SP263 の間で高い一致度が得られたという先行研究の小規模な知見と一致する。

臨床応用: 本知見は、標準化された高品質の PD-L1 検査へのアクセスを1施設1プラットフォームで実現できる可能性を示唆し、臨床現場における PD-L1 テストの効率化と、より多くの患者への高品質な PD-L1 情報提供を可能にするための重要な基盤的エビデンスを提供する。適切な臨床的アルゴリズム (薬剤と対応するカットオフの対応) を遵守することを条件に、これら 3 アッセイを互換的に使用してよいとする判断を支持する。これにより、病理検査室は複数のアッセイプラットフォームを維持する必要がなくなり、資源の節約と検査の迅速化に貢献できる。

残された課題: 本研究の結論は 22C3・28-8・SP263 の 3 クローンに限定されるものであり、他のクローンや他の腫瘍種への外挿は別途検証が必要である。また、PPA は NPA より変動が大きく、使用するカットオフや比較するアッセイの組み合わせによって最適化が可能である一方、OPA が低下する trade-off も存在する。今後の検討課題として、病理医のトレーニング、特に低カットオフでの判定精度向上に向けたトレーニングの充実が不可欠であることも強調される。これは、アッセイ間の互換性を確保する上で、人的要因が重要な limitation となりうることを示唆する。PD-L1 発現は連続変数であるため、単純な陽性/陰性分類では治療選択に必要な柔軟性が得られない可能性があり、より詳細な発現レベルの評価と臨床的意義の関連付けが今後の研究で求められる。

方法

商業ソース (Asterand、ProteoGenex、Tissue Solutions) から入手した NSCLC 500 例のホルマリン固定パラフィン包埋 (FFPE: Formalin-Fixed, Paraffin-Embedded) アーカイブ検体を使用した。サンプルは切除から 1〜4 年のものであり、連続切片を作製して 3 種類のアッセイで同一腫瘍組織を染色した。最終的な解析対象は 493 例であり、7 例はサンプル品質基準を満たさなかったため除外された。

染色スライドは CLIA (Clinical Laboratory Improvement Amendments) 認定臨床検査室 (Hematogenix) において、各製造元により訓練された単一の病理医が、腫瘍細胞膜染色を評価基準としてバッチ単位で一括判定した。免疫細胞染色ではなく腫瘍細胞膜染色のみを評価対象とした。アッセイ間のバイアスを防ぐため、ウォッシュアウト期間 (SP263/22C3 間 29 日、SP263/28-8 間 3 日、28-8/22C3 間 26 日) を設定した。Ventana SP263 は当初 25% 以上の染色を評価対象として設計されていたため、1%, 5%, 10% カットオフでの追加スコアリングをウォッシュアウト後に別途実施し、Dako 22C3 および Dako 28-8 との直接比較を可能とした。

主要解析指標として、全体一致率 (OPA: Overall Percentage Agreement)、陽性一致率 (PPA: Positive Percentage Agreement)、陰性一致率 (NPA: Negative Percentage Agreement) を複数カットオフ値 (1%, 10%, 25%, 50%) で算出した。95% 信頼区間 (CI: Confidence Interval) は Clopper-Pearson 法で算出した。OPA > 90% を IHC の標準的なアッセイ内一致率の基準とした。

さらに、200 例のサブセットについて独立した病理医による追加レビューを実施し、観察者間一致率を評価した。この独立レビューにおいても、バイアスを避けるために各症例および各アッセイ間でウォッシュアウト期間を設けた。観察者間一致率は、臨床的に関連する 1%, 10%, 25%, 50% の PD-L1 発現カットオフレベルで OPA を算出した。統計解析には、アッセイ間の相関を評価するためにスピアマン相関係数 (Spearman correlation coefficient) を用いた。