• 著者: Sylvie Lantuejoul, Ming Sound-Tsao, Wendy A. Cooper, et al.
  • Corresponding author: Sylvie Lantuejoul (Centre Leon Berard, Lyon, France); Mari Mino-Kenudson (Massachusetts General Hospital, Boston, MA, USA)
  • 雑誌: Journal of Thoracic Oncology
  • 発行年: 2020
  • Epub日: 2019-12-06
  • Article種別: Review
  • PMID: 31778799

背景

肺癌治療における免疫チェックポイント阻害剤 (ICI) の導入は、過去数年間で治療パラダイムを劇的に変化させた。非小細胞肺癌 (NSCLC) では、pembrolizumab (KEYNOTE-024試験で腫瘍細胞PD-L1発現率 (TPS) ≥50%の患者に対する単剤療法、KEYNOTE-042試験でTPS≥1%の患者に対する単剤療法、KEYNOTE-189/407試験で化学療法併用療法)、atezolizumab (IMpower133試験で進展型小細胞肺癌 (ES-SCLC) 併用療法、IMpower150試験でNSCLC併用療法、OAK試験で二次単剤療法)、nivolumab (CheckMateシリーズ)、durvalumab (PACIFIC試験で局所進行NSCLC維持療法、CASPIAN試験でES-SCLC併用療法) などが標準治療として確立されている。これらの適応の一部では、PD-L1発現がコンパニオン診断としてバイオマーカーの役割を担う。しかし、市販されているPD-L1免疫組織化学 (IHC) アッセイ (Dako 22C3、Dako 28-8、Ventana SP263、Ventana SP142) は、それぞれ異なる抗体クローン、染色プラットフォーム、およびスコアリングアルゴリズム (TPS、Combined Positive Score (CPS)、免疫細胞 (IC) 割合、腫瘍細胞 (TC) 割合) を使用しており、臨床現場での実装に混乱を招いていることが指摘されていた。例えば、Blueprint Projectの相互比較研究では、アッセイ間の感度や一致率に差異があることが報告されており、特にSP142アッセイは他の3アッセイと比較してTC染色感度が低いことが示されている Tsao et al. JThoracOncol 2018。このような状況は、適切な患者選択と治療効果の最大化を妨げる可能性があり、PD-L1検査の標準化が喫緊の課題として認識されていた。

国際肺癌学会 (IASLC) 病理委員会は、主要な臨床試験データやBlueprint Projectの相互比較研究の結果を統合し、PD-L1検査の標準化を目的として本レビューを発表した。先行研究では、PD-L1 IHCアッセイの分析的比較が行われてきたが、実臨床における解析前変数 (検体タイプ、固定時間、保存条件など) の管理基準や、病理医間の判読一致率のばらつきといった、実臨床における品質確保に関する具体的な指針が不足していた点が、本レビューの重要な背景となっている。特に、病理医間の判読一致率の低さは、PD-L1検査の信頼性を損なう可能性があり、その改善は未解明な課題として残されていた。PD-L1発現は、ICI治療の有効性を予測する重要なバイオマーカーであるが、その評価には多岐にわたる要因が影響するため、標準化された包括的なガイドラインの必要性が強く認識されていた。

目的

本レビューの目的は、肺癌領域におけるPD-L1 IHC検査の2019年時点での現状を包括的にレビューし、実臨床における標準化と品質確保のための提言を行うことである。具体的には、4種類の承認済みアッセイ (22C3、28-8、SP263、SP142) の比較、各臨床試験で用いられたカットオフ値、検体の適切性、解析前変数 (pre-analytical variables) の管理、アッセイ間の互換性、小細胞肺癌 (SCLC) を含む適応拡大の状況、および将来的な展望 (multiplex IHC、腫瘍変異負荷 (TMB)、ネオアンチゲンなど) について議論し、実践的なガイドラインを提供することを目指した。特に、病理医間の判読一致率の現状と、その改善に向けたトレーニングの重要性についても焦点を当て、PD-L1検査の信頼性を高めるための具体的な方策を提示することを目的とした。本レビューは、PD-L1 IHC検査の適切な実施と解釈に関する知識ギャップを埋め、臨床現場での一貫性と正確性を向上させることを目指している。

結果

NSCLCにおけるICI承認適応とPD-L1カットオフの整理: 2019年時点での肺癌ICI承認適応は、主に以下のカテゴリーに分類される。転移性NSCLCの一次治療単剤療法として、pembrolizumabはKEYNOTE-024試験でTPS≥50%の患者に対し、化学療法と比較して有意な無増悪生存期間 (mPFS) 延長 (10.3ヶ月 vs 6.0ヶ月、HR 0.50 (95% CI 0.37-0.68, p<0.001)) および全生存期間 (OS) 延長 (HR 0.63 (95% CI 0.47-0.86, p<0.001)) を示した (Table 3)。KEYNOTE-042試験ではTPS≥1%でOSの有意な改善 (HR 0.81 (95% CI 0.71-0.93, p=0.0018)) が報告されたが、その大部分はTPS≥50%のサブグループに集中し、TPS 1〜49%では有意差が消失した。転移性NSCLCの一次治療化学療法併用療法では、pembrolizumab+platinum-pemetrexed (KEYNOTE-189) でmPFS 8.8ヶ月 vs 4.9ヶ月 (PFS HR 0.52 (95% CI 0.43-0.64, p<0.001))、OS HR 0.49 (95% CI 0.38-0.64, p<0.001) が示された (Table 4)。これらの化学療法+ICI併用レジメンはPD-L1発現を問わず使用可能である。二次治療以降では、nivolumab、atezolizumabはPD-L1非選択的に、pembrolizumabはTPS≥1%で使用可能である。局所進行NSCLC (unresectable stage III) の化学放射線療法後のdurvalumab維持療法 (PACIFIC試験) では、mPFS 16.8ヶ月 vs 5.6ヶ月 (PFS HR 0.52 (95% CI 0.42-0.65, p<0.001))、OS HR 0.68 (95% CI 0.47-0.997, p=0.0025) が報告された。しかし、この試験はPD-L1発現が組み入れ基準でも層別化因子でもなく、ベースライン検体が64%のみでの非計画後ろ向き解析であるため、TPS≥1%の制限の科学的根拠は前向き検証を要するとの重要な注記が付された。

SCLCにおける承認適応とPD-L1検査の位置づけ: 進展型SCLC (ES-SCLC) に対しては、IMpower133試験 (atezolizumab+carboplatin-etoposide) でmPFS 5.2ヶ月 vs 4.3ヶ月 (PFS HR 0.77 (95% CI 0.62-0.96, p=0.02))、mOS 12.3ヶ月 vs 10.3ヶ月 (OS HR 0.70 (95% CI 0.54-0.91, p=0.007)) が示され、atezolizumabが承認されている。CASPIAN試験 (durvalumab+platinum-etoposide) でもOS改善が示されたが、2019年9月時点ではまだ承認前であった。これらの試験はいずれもPD-L1発現によるサブグループ解析で明確なベネフィット差を示さず、SCLCではPD-L1は治療選択のバイオマーカーとして機能しないことが示唆された。3次治療以降のSCLCに対してはpembrolizumabが米国のみで承認されており (KEYNOTE-028/158プール解析: 客観的奏効率 (ORR) 19%)、14/16の奏効例がPD-L1 Combined Positive Score (CPS) ≥1であったが、承認はPD-L1非依存である。本論文では、SCLCにおけるPD-L1 IHCの課題として、腫瘍細胞PD-L1発現が低頻度 (5〜20%) で層別化が困難であることが強調されており、免疫細胞PD-L1は31〜71%と高率に発現するものの、その臨床的意義は確立していない。

4種のPD-L1 IHCアッセイの特徴と承認状況: PD-L1 IHCアッセイには、主に4種類が存在する (Table 1, 2)。①22C3 PharmDx (Dako): pembrolizumab用コンパニオン診断薬であり、米国食品医薬品局 (FDA)、欧州体外診断用医療機器指令 (CE-IVD)、医薬品医療機器総合機構 (PMDA) の承認を受けている。スコアはTPSで、TPS≥1%またはTPS≥50%が臨床的カットオフとなる。最低100個の腫瘍細胞の評価が必要である。②28-8 PharmDx (Dako): nivolumab用補完的診断薬であり、スコアはTPSで、1%、5%、10%のカットオフが各適応で使用される。③SP263 (Ventana BenchMark ULTRA): durvalumab、pembrolizumab、nivolumabのCE-IVD認定を受けている (欧州)。スコアはTPSである。④SP142 (Ventana BenchMark ULTRA): atezolizumab用補完的診断薬であり、TC (TPS) とIC (腫瘍浸潤免疫細胞が占める腫瘍面積割合) の両方をスコアリングする。TC≥50% (TC3) またはIC≥10% (IC3) が高発現と定義される。コンパニオン診断薬は治療前に実施が必須である一方、補完的診断薬は治療選択を補助するが必須ではない点が重要な区別である。

Blueprint Projectによる4アッセイ相互比較の主要結果: Blueprint Phase 1 Marchetti et al. JThoracOncol 2017 および Phase 2 Tsao et al. JThoracOncol 2018 は、4種の承認アッセイを比較した最も重要な研究である (Table 6)。計14の研究が4アッセイを比較しており、一貫した結論として、(a) 22C3、28-8、SP263の3アッセイはTC染色においておおむね類似した感度と一致率を示し (weighted kappa 0.64〜0.95)、互換使用可能 (臨床的同等性) と判断された。(b) SP142は他の3アッセイと比較して有意に低いTC染色感度を示し、他アッセイの36〜59%の腫瘍細胞しか染色しないことが複数の研究で一貫して報告されている (Fig 2, 3)。SP263はむしろ22C3、28-8より若干高い染色性を示す傾向があり (Scheel 2016でSP263が他アッセイより44〜59%高い腫瘍細胞比率)、durvalumabの欧州医薬品庁 (EMA) 承認でSP263がCE-IVD認定された根拠となっているが、スコアの高感度さゆえに22C3との判定差がdurvalumab TPS≥1%の判定で臨床的影響をもたらす可能性が指摘されている。IC染色については全研究でTC染色より低い一致率 (ICC 0.18〜0.27) が示されており、SP142は他アッセイより低いIC染色感度を持つ (28-8が最も高い)。IC scoringの再現性の低さが臨床実装の課題となっている。

ラボ開発検査 (LDT) の使用と品質確保: 臨床試験で検証された4アッセイを使用しないすべての検査はLDTと定義される。LDTは経済的・プラットフォーム制約上の理由から各国で広く使用されているが、Adam et al. (Ann Oncol 2018、フランス多施設) では27件のLDTのうち13件 (48%) が標準アッセイとのkappa≥0.75を達成できなかった。一方でRimm et al. (JAMA Oncol 2017) はE1L3N cloneを用いたLDTが標準アッセイに匹敵するパフォーマンスを達成可能であることを示した (ただし大規模なバリデーションの後)。LDT使用時には1%および50%の両カットオフ周辺の症例を含む適切なバリデーションが必須であり、米国病理学会 (CAP) ガイドラインでは少なくとも20陽性・20陰性例での検証が推奨されている。実践的なアプローチとして、LDTと標準アッセイで20連続症例を染色し、80〜90%の一致率・2〜3症例以内の局所的不一致を目標とすることが推奨されている。外部品質評価 (EQA) への参加も強く推奨され (NordiQC、英国外部品質評価スキーム (UK NEQAS) 等)、一部国では義務化されている。

解析前変数 (Pre-analytical variables) の管理基準: PD-L1染色品質に影響する重要な解析前変数が整理された (Table 5)。Cold ischemia time (CIT) は30分以内 (最大60分以内) が推奨され、固定の遅延が膜染色PD-L1発現の低下を引き起こすことが示されている (van Seijen et al., Virchows Arch 2019)。固定剤として10%中性緩衝ホルマリン (NBF) が理想的 (zinc formalinはSP263で許容) で、固定時間は生検・細胞ブロックで6〜48時間、切除検体で24〜48時間 (最大72時間まで許容) とされた。アルコール系固定剤 (AFA、PREFER等) はSP263・SP142アッセイでの特異的染色消失が報告されており推奨されない。切片厚は3〜5μmで陽性荷電スライドに固定。染色は切片作製後できるだけ早期 (2ヶ月以内推奨、2〜8℃保存で最大12ヶ月まで許容) に実施すべきである。パラフィンブロックは3年以内のものを使用推奨 (最大5年まで許容)。PD-L1発現は光酸化・抗原劣化によって1〜3年以上保存ブロックで低下する可能性があり、長期保存切片の使用は避けるべきとされる。評価に必要な最低腫瘍細胞数は100細胞以上 (single biopsyで100 TC以上が応答予測に必要: Naito et al., JTO 2019)。

検体種別と腫瘍内不均一性: 生検と切除標本の一致率は使用アッセイ・カットオフにより70〜96% (SP142で最低50%、他アッセイで70〜96%) と幅がある。Kim et al. (2019) では1%カットオフで96%・91%、50%カットオフで73%・80%の一致率が報告された (22C3・SP263それぞれ)。腫瘍内不均一性 (intratumoral heterogeneity) は実際に問題となり得るため、全腫瘍を代表する切片の選択が重要である。原発腫瘍と脳転移間の不一致率は14% (TC発現、kappa 0.71) 〜26% (腫瘍浸潤リンパ球 (TIL) PD-L1、kappa 0.38) (Mansfield et al., Ann Oncol 2016) と比較的高く、6ヶ月以上間隔をあけた検体ではさらに高い不一致率が報告されている。細胞診検体 (細胞ブロック・スメア・液状化検体 (LBC)) については、Blueprint Phase 2Bで組織大断片・小生検・穿刺吸引細胞診 (FNA) 細胞ブロックの3種間で匹敵するパフォーマンスが確認された (ICC 0.78〜0.85)。アルコール系固定剤の影響や細胞数不足 (100細胞未満) が精度低下要因となる。

病理医間変動と判読一致率: TCスコアリング (TPS) においては4アッセイ間で良好な一致率が示された (Blueprint Phase 2: ICC 0.86〜0.95; Rimm 2017: ICC 0.83〜0.88) (Table 7)。Ratcliffe et al. ClinCancerRes 2017 では22C3アッセイで全体の一致率 (overall percent agreement) 84.2% (1%カットオフ) ・81.9% (50%カットオフ) が報告された。バイナリ分類での一致率は50%カットオフの方が1%カットオフより高い傾向 (50%での kappa 0.75 vs 1%での kappa 0.54: Rimm 2017) がある。一方、ICスコアリングは全研究で極めて低い再現性 (ICC 0.18〜0.27) であり、SP142のみが0.27〜0.28と若干高い値を示した (Blueprint Phase 2)。Rimm 2017では22C3・28-8のICスコアリングICCが0.17〜0.23と低く、Scheel 2016ではkappa 0.12〜0.25と報告されている。ICスコアリングの再現性改善が臨床実装の重要課題として認識されている。トレーニングの役割については、Adam et al. (JTO 2019、161名の病理医のリアルワールド研究) では病理医のPD-L1一致率がスコアリングトレーニング経験・週間検査数と相関し、胸部病理経験年数・施設種別 (私立・市中病院・大学病院) との相関はなかったとされた。

化学療法・放射線療法後のPD-L1発現変動: 化学療法や放射線療法はPD-L1発現を変動させうる。ネオアジュバント化学療法後の発現変化が14〜57.1%の症例で報告されており (Zhang et al., Cancer Sci 2016; Sheng et al., Sci Rep 2016)、「高いPD-L1発現が化学療法抵抗性・予後不良と関連する」との報告 (Zhang et al.) もある一方、発現増加・低下・維持のいずれも報告されている。EGFR-TKIはPD-L1発現を増加させる可能性があり (Omori et al., Int J Clin Oncol 2018)、ATLANTICコホート分析 (Boothman et al., JTO 2019) では化学療法・放射線療法前サンプリングは有意なPD-L1発現増加と関連していたが、TKIは関連しなかった。これらの知見は、検体採取時期と先行治療歴の記録の重要性を示している。

PD-L1の予後マーカーとしての意義 (NSCLC): PD-L1発現は術後NSCLCの予後予測に関して複数の研究で相反する結果が報告されているが、Li et al. (Transl Lung Cancer Res 2019) の50研究・11,383例のメタ解析では、PD-L1 IHC高発現がOS短縮と関連 (HR 1.45 (95% CI 1.24-1.68)) し、特に切除標本・5%カットオフ・早期ステージ (I〜III) ・アジア人サブグループで有意であった。腺癌・扁平上皮癌・lymphoepithelioma-like carcinomaで有意、SCLCでは有意でなかった。

品質保証と標準化報告書式: 内部品質管理として陽性コントロール (on-slide推奨) の使用が必須で、肺胞マクロファージを内部コントロールとして活用可能である。スコア分布モニタリングも推奨され、試験で検証された22C3・SP263アッセイ使用時、TPS<1%が50%未満、TPS≥50%が20〜30%に分布するという基準値の遵守が推奨されている。標準化報告書式として、検体情報 (患者ID、検体ID、実施日、組織学的診断、検体種別、固定液、評価腫瘍細胞数の適切性) ・検査方法情報 (抗体クローン、オートスタイナープラットフォーム、承認アッセイかラボ開発検査 (LDT) か) ・陽性・陰性コントロールの染色適切性・患者検体のPD-L1発現結果 (各アッセイの判定マニュアルに従い、22C3・28-8・SP263はTPS報告、SP142はIC・TC別報告) が含まれるべきとされた。

考察/結論

本レビューは、肺癌PD-L1検査の実臨床における標準化と品質確保を目的とした包括的合意文書として、病理医、腫瘍内科医、臨床検査室の橋渡しを担う重要な位置づけを持つ。先行するBlueprint Project Marchetti et al. JThoracOncol 2017Tsao et al. JThoracOncol 2018 の分析的比較結果を臨床判断レベルに落とし込んだ実践的文書である点が本研究の新規性と言える。

先行研究との違い: 本レビューは、これまで個別に報告されてきたPD-L1 IHCアッセイの比較研究や臨床試験の結果を統合し、特に14の研究を分析した結果として「22C3、28-8、SP263は互換可能である一方、SP142は互換不可である」という明確な結論を提示した点で、これまでの報告と異なる。また、解析前変数の管理基準 (Cold Ischemia Time (CIT)、固定時間、保存条件など) を具体的な数値を伴って提示したこと、SCLCにおけるPD-L1の限界を明示したこと、およびICスコアリングの再現性が低くTCのみのTPSが信頼性高いことを示した点も、先行研究と比較して詳細かつ実践的な指針を提供している。

新規性: 本レビューは、IASLC病理委員会という国際的な専門家集団の合意形成に基づき、PD-L1 IHC検査の各側面におけるベストプラクティスを包括的に提示した点で新規性が高い。特に、病理医間の判読一致率の改善に向けたトレーニングの重要性を強調し、その効果を裏付けるリアルワールドデータ (Adam et al., JTO 2019) を引用したことは、PD-L1検査の品質向上に直結する臨床的意義を持つ。これまで報告されていない、PD-L1 IHC検査の包括的な標準化と品質保証に関する実践的なガイドラインを提供したことは、本研究の大きな新規性である。

臨床応用: 本知見は、PD-L1 IHC検査の適切な実施と解釈を標準化し、免疫チェックポイント阻害剤の適応患者をより正確に選択するための臨床応用に直結する。特に、ラボ開発検査 (LDT) を使用する施設におけるバリデーション基準や外部品質評価 (EQA) への参加推奨は、検査結果の信頼性を高め、患者が適切な治療を受けられるようにするための臨床現場での重要な指針となる。PACIFIC試験のpost-hoc分析に基づくdurvalumabのTPS≥1%制限に関する注記は、エビデンスの限界を認識し、臨床判断の慎重さを促す上で臨床的有用性が高い。

残された課題: 今後の検討課題として、①SCLC特異的バイオマーカー評価法の標準化 (TMBや腫瘍浸潤リンパ球 (TIL) 評価との統合)、②アッセイ切替時の臨床判断の連続性保証、③PD-L1非依存レジメン拡大下での検査運用の見直し、④次世代バイオマーカー (TMB、ネオアンチゲン、CD8 TIL、腸内細菌叢) との統合戦略の確立、⑤ICスコアリングの再現性改善への技術開発が残されている。特に、ICスコアリングの低再現性は、SP142アッセイの臨床的有用性を制限する可能性があり、その改善に向けた技術的・トレーニング的アプローチが今後の研究で求められる。本レビューは、PD-L1検査の信頼性向上に向けた重要な一歩であるが、これらのlimitationへの対応が今後の研究の方向性となる。

方法

本論文はレビューおよびポジションペーパーであり、特定の実験的手法は用いられていない。IASLC病理委員会に所属する33名のメンバーが、主要な免疫チェックポイント阻害剤 (ICI) 関連臨床試験 (KEYNOTEシリーズ、CheckMateシリーズ、IMpowerシリーズ、PACIFIC試験、CASPIAN試験など) のプロトコルおよび結果を詳細に分析した。また、PD-L1 IHCアッセイの相互比較を目的としたBlueprint Project (第1相および第2相) の結果、複数の多施設横断研究、および各加盟国の病理診断ラボにおける実臨床経験を統合し、議論を重ねた。これらの情報を基に、PD-L1 IHC検査の解析前、分析的、および解析後の側面における重要な考慮事項を特定し、標準化された実践ガイドラインを策定した。

レビュー対象となった論文は、PubMed、Embase、Cochrane Libraryなどの主要な医学データベースから検索され、関連性の高いものが選定された。検索期間は特に明記されていないが、2019年時点での最新情報を網羅するように設計された。論文の選定は、IASLC病理委員会のメンバーが関連性の高い研究を特定し、合意形成に基づいて行われた。統計手法としては、先行研究で報告された一致率 (kappa値、級内相関係数 (ICC)) などの統計的指標が参照された。特に、病理医間の判読一致率に関するデータは、Fleiss’s kappa統計量やCohen’s kappa統計量を用いて評価された研究結果が引用されている。本レビューは、特定の研究デザインやPRISMAフローチャートに基づく系統的レビューではないが、広範な文献と専門家の合意に基づくエビデンスレベルの高い提言を目指した。