- 著者: Gadgeel S, Hirsch FR, Kerr K, Barlesi F, Park K, Rittmeyer A, Zou W, Bhatia N, Koeppen H, Paul SM, Shames D, Yi J, Matheny C, Ballinger M, McCleland M, Gandara DR
- Corresponding author: Shirish Gadgeel, MD (Henry Ford Cancer Institute / Henry Ford Health System, Detroit, MI, USA)
- 雑誌: Clinical Lung Cancer
- 発行年: 2022
- Epub日: N/A
- Article種別: Original Article (Retrospective Analysis of Phase III Trial)
- PMID: 34226144
背景
進行非小細胞肺がん (NSCLC) において、免疫チェックポイント阻害薬は治療体系を劇的に変化させた。抗PD-L1抗体であるアテゾリズマブは、既治療進行NSCLC患者を対象としたランダム化第III相OAK試験 (NCT02008227) において、ドセタキセルと比較して生存期間を有意に延長することが示されている。このOAK試験では、PD-L1発現の評価にVENTANA SP142 (Ventana Medical Systems製) 免疫組織化学 (IHC) アッセイが用いられ、腫瘍細胞 (TC; tumor cells) および腫瘍浸潤免疫細胞 (IC; tumor-infiltrating immune cells) の両方における発現状況が評価された。一方、ペムブロリズマブなどの他の免疫チェックポイント阻害薬では、Dako 22C3アッセイを用いた腫瘍比率スコア (TPS; tumor proportion score) がコンパニオン診断として広く臨床応用されている。
がん免疫サイクルにおけるPD-L1の役割については Chen et al. Immunity 2013 や Zou et al. NatRevImmunol 2008 などの先行研究で詳細に論じられており、PD-L1発現と治療効果の相関については Herbst et al. Nature 2014 でも報告されている。さらに、Shepherd et al. JClinOncol 2000 はドセタキセルの有効性を示し、Herbst et al. Lancet 2016 はペムブロリズマブの治療効果を検証した。しかし、臨床現場において異なるPD-L1 IHCアッセイが混在する中、SP142アッセイと22C3アッセイがアテゾリズマブの治療効果予測において同様の臨床的有用性を持つかについては十分に検証されておらず、アッセイ間の臨床的な一致率や予測能の比較は未解明のままであった。
特に、異なるカットオフ値における治療効果の予測能の差異を直接比較したデータが不足しており、実臨床におけるアッセイ選択の標準化に向けた大きな課題となっていた。Blueprint PDL1 IHC Assay Comparison Projectなどの先行研究では、TC (腫瘍細胞) ベースのアッセイは高い分析的一致性を示す一方、SP142はTC およびIC染色の両方に対して感度が低いことが報告されている。しかし、検証済みカットオフ値における臨床的感度 (clinical sensitivity) の比較は、既治療NSCLC患者では十分に検討されていない。このように、異なる評価アルゴリズムを持つアッセイ間の臨床的同等性に関する検証が不足している点は、最適なバイオマーカー選択における重要な課題として残されている。また、分析的一致性 (analytical concordance) と臨床的予測能 (clinical predictiveness) は異なる概念であり、後者に焦点を当てた大規模臨床試験コホートでの検証は不足していた。
目的
本研究の目的は、ランダム化第III相OAK試験の患者コホートを対象として、VENTANA SP142アッセイとDako 22C3アッセイの2つの異なるPD-L1 IHCアッセイにおけるPD-L1発現状況を後向きに評価・比較することである。具体的には、アテゾリズマブとドセタキセルの治療効果 (全体生存期間 [OS]、無増悪生存期間 [PFS]、客観的奏効率 [ORR]) の予測において、両アッセイが同様の予測的価値を持つかを検証する。さらに、両アッセイ間における陽性・陰性判定の一致率 (インターアッセイ一致率) を明らかにし、両アッセイで陽性となる患者群 (double-positive) や、いずれか一方のみで陽性となる患者群における治療ベネフィットの差異を評価することで、実臨床における代替的なアッセイ活用の妥当性を検証することを目的とする。本解析により、異なるスコアリングアルゴリズムを有するアッセイが臨床的には同等の予測能を持つかどうかを明確にし、PD-L1ベースの治療選択における標準化を支援することを目指している。
結果
22C3-BEPにおけるアテゾリズマブの全体的な生存ベネフィット: 22C3-BEP全体 (n=577) において、アテゾリズマブ群 (n=295) はドセタキセル群 (n=282) と比較して、主要評価項目であるOSの有意な延長を示した。OS中央値は、アテゾリズマブ群で 12.3 vs 8.2 months であり、OSのハザード比は HR 0.65 (95% CI 0.54-0.78, p<0.001) と極めて良好な結果であった (Fig 1)。また、PFSの中央値はアテゾリズマブ群で 2.8 vs 3.1 months であり、ハザード比は HR 0.80 (95% CI 0.67-0.95, p=0.011) であった。ORRについては、アテゾリズマブ群が16%であったのに対し、ドセタキセル群は9%であり、奏効率の差は ΔORR 7% (95% CI 1-12%, p=0.015) とアテゾリズマブ群で有意に高かった (Fig 3)。これらの結果は、ITT集団全体における治療効果と一貫していた。
SP142高発現群における最大の生存ベネフィット: VENTANA SP142アッセイによる高発現群 (TC3またはIC3、n=94) におけるアテゾリズマブ群のドセタキセル群に対するOSのハザード比は HR 0.39 (95% CI 0.25-0.63, p<0.001) であり、極めて強力な生存ベネフィットが示された (Fig 2)。この群における生存期間中央値の差は約11ヶ月に達した。PFSについても同様の傾向が見られ、SP142高発現群では HR 0.50 (95% CI 0.32-0.80, p=0.003) であった。ORRについては、SP142高発現群でアテゾリズマブ群が27%、ドセタキセル群が5%であり、奏効率の差は ΔORR 22% (95% CI 6-38%) と最大の差が認められた (Fig 3)。
22C3高発現群における生存ベネフィット: Dako 22C3アッセイによる高発現群 (TPS 50%以上、n=138) におけるOSのハザード比は HR 0.56 (95% CI 0.38-0.82, p=0.003) であった (Fig 2)。PFSについては HR 0.52 (95% CI 0.36-0.76, p<0.001) であり、高発現群で有意な改善が認められた。ORRについては、22C3高発現群でアテゾリズマブ群が26%、ドセタキセル群が9%であり、奏効率の差は ΔORR 17% (95% CI 4-31%) であった (Fig 3)。いずれのアッセイにおいても、高発現群で最も高い治療効果が予測可能であることが確認されたが、SP142高発現群においてより強い効果量が観察された。
PD-L1中等度発現群における生存ベネフィットの差異: PD-L1中等度発現群におけるOSベネフィットを解析した。Dako 22C3アッセイによる中等度発現群 (TPS 1%から50%未満、n=133) において、アテゾリズマブ群はドセタキセル群に対して有意なOS延長を示し、ハザード比は HR 0.55 (95% CI 0.37-0.82, p=0.003) であった。これに対し、VENTANA SP142アッセイによる中等度発現群 (TC1/2またはIC1/2、n=266) におけるOSのハザード比は HR 0.82 (95% CI 0.64-1.06, p=0.13) であり、統計的な有意差には至らなかった。この結果は、SP142アッセイの中等度発現群には、22C3アッセイで陰性と判定されるような比較的PD-L1発現の低い患者層が多く含まれていることを示唆している。PFSについても同様の傾向が見られ、22C3中等度発現群では HR 0.77 (95% CI 0.53-1.12) であった。
PD-L1陰性群における治療効果の維持: 両アッセイにおいてPD-L1陰性と判定された患者群におけるOSを解析した。VENTANA SP142アッセイ陰性群 (TC0およびIC0、n=215) におけるアテゾリズマブ群のドセタキセル群に対するOSのハザード比は HR 0.66 (95% CI 0.49-0.89, p=0.006) であった。同様に、Dako 22C3アッセイ陰性群 (TPS 1%未満、n=306) におけるOSのハザード比は HR 0.75 (95% CI 0.59-0.97, p=0.028) であった。このように、いずれのアッセイで陰性と判定された患者群であっても、アテゾリズマブはドセタキセルに対して有意なOSの改善効果を示した。なお、PFSについては両アッセイの陰性群ともにアテゾリズマブによる有意な改善は認められなかった。
両アッセイ同時陽性例における最大ベネフィット: VENTANA SP142アッセイ (TC1/2/3またはIC1/2/3) とDako 22C3アッセイ (TPS 1%以上) の両方で陽性と判定されたダブル陽性群において、最大のOSベネフィットが認められた。このダブル陽性群 (n=215) におけるOSのハザード比は HR 0.55 (95% CI 0.40-0.75, p<0.001) であり、生存期間中央値の差は 6.6 months であった (Fig 4, Fig 5)。さらに、SP142高発現 (TC3またはIC3) かつ22C3高発現 (TPS 50%以上) のダブル高発現群 (n=60) では、最も強力なベネフィットが観察され、OSのハザード比は HR 0.38 (95% CI 0.21-0.69, p=0.001) であり、生存期間中央値の差は 14.0 months に達した (Fig 4, Fig 5)。これに対し、両アッセイで陰性と判定されたダブル陰性群 (VENTANA SP142 TC0/IC0かつDako 22C3 TPS 1%未満) におけるOSのハザード比は HR 0.72 (95% CI 0.58-0.90, p=0.004) であった (Fig 5)。また、SP142陽性かつ22C3陰性の群では HR 0.90 (95% CI 0.62-1.29, p=0.55) とベネフィットが限定的であった (Fig 5)。PFSについても同様の傾向が見られ、ダブル高発現群では HR 0.38 (95% CI 0.21-0.69) と優れた効果が示された (Fig 4)。
アッセイ間の不完全な一致率と発現パターンの特徴: VENTANA SP142アッセイとDako 22C3アッセイの間の一致率は不完全であった。SP142陽性例 (TC1/2/3またはIC1/2/3、n=360) のうち、22C3陽性 (TPS 1%以上) と判定されたのは60% (215例) であった。また、SP142高発現例 (TC3またはIC3、n=94) のうち、22C3高発現 (TPS 50%以上) と判定されたのは64% (60例) であった。SP142アッセイで独自に陽性と判定された症例の多くは、TCではなくIC陽性 (IC1/2/3) であり、VENTANA SP142が免疫細胞上のPD-L1発現を捉える特性が示された。具体的には、SP142で独自に高発現と判定された患者の大多数がIC3であり、TC3ではなかった。一方、TCのみの評価に限定した場合、Dako 22C3アッセイの方がより広い患者群を陽性と判定する傾向があった。SP142 TC1/2またはIC1/2群 (n=266) のうち、22C3で低発現 (TPS 1-50%) と判定されたのは31% (82例) であった。
考察/結論
本研究は、既治療進行NSCLC患者を対象としたOAK試験の後向き解析を通じて、VENTANA SP142アッセイとDako 22C3アッセイという異なる評価アルゴリズムを持つPD-L1 IHCアッセイが、それぞれの検証済みカットオフ値においてアテゾリズマブの生存ベネフィットを同様に予測可能であることを示した。
先行研究との違い: 本研究の結果は、アッセイ間の分析的一致性が低いとしたBlueprint PDL1 IHC Assay Comparison Projectなどの先行研究と異なり、臨床的な治療効果予測能においては両アッセイが極めて類似した高い有用性を持つことを実証した。分析的一致性 (analytical concordance) と臨床的予測能 (clinical predictiveness) は異なる概念であり、本解析は後者に焦点を当てた点で対照的である。Rittmeyer et al. Lancet 2017 のOAK試験主論文では単一のVENTANA SP142アッセイが用いられていたが、本解析は同一コホートで2つのアッセイを直接比較した点で新規である。
新規性: 本研究で初めて、アテゾリズマブの第III相臨床試験コホートにおいて、VENTANA SP142とDako 22C3の臨床的予測能を直接比較し、両アッセイで陽性となるダブル陽性患者において HR 0.55 という有意な生存ベネフィットが得られることを新規に明らかにした。特に、SP142高発現かつ22C3高発現のダブル高発現群では HR 0.38 という最大の生存ベネフィットが得られることを新規に示した。また、いずれのアッセイで陰性と判定された患者であっても、アテゾリズマブがドセタキセルに対して一貫してOSを改善することを新規に示した。これは、PD-L1陰性患者においても免疫チェックポイント阻害薬の有効性が存在することを示唆する重要な知見である。
臨床応用: 本知見の臨床的意義として、実臨床においてVENTANA SP142アッセイが利用できない施設であっても、広く普及しているDako 22C3アッセイの結果を用いてアテゾリズマブの治療効果を十分に予測可能であることが挙げられる。これは、治療選択肢の最適化やバイオマーカー検査の効率化といった臨床現場における意思決定に直結する。さらに、Planchard et al. AnnOncol 2018 が推奨するPD-L1検査の実施において、複数のアッセイが臨床的に同等の価値を持つことが確認されたことは、検査法の選択肢を広げ、検査の実施可能性を向上させる。本結果は、第一線治療におけるPD-L1ベースの治療選択の標準化にも貢献する。
残された課題: 今後の検討課題として、本解析が後向きの探索的解析であること、および22C3-BEPにおいてアジア人患者の割合が低かったことによる一般化の限界が挙げられる。具体的には、22C3-BEPではアジア人患者の割合がアテゾリズマブ群で3.4%、ドセタキセル群で5.7%であり、SP142-ITT全体の約20%と比較して著しく低かった。これは、アジア地域で提供されるサンプルがスライドであり、組織ブロックではないことが多いため、6ヶ月の組織安定性ウィンドウを満たさないことが原因と考えられる。また、PD-L1陰性例における治療効果の予測には、腫瘍遺伝子変異量 (TMB; tumor mutational burden) などの新たなバイオマーカーとの併用評価が必要であり、これが今後の重要な研究方向性となる。OAKおよびPOPLAR試験の解析では、血液TMBと生存期間 (PFS および OS) の間に関連性が報告されており、特にPD-L1高発現群におけるTMBの予測的価値が示唆されている。今後、複数のバイオマーカーを組み合わせた層別化戦略が必要とされる。
方法
本研究は、既治療進行NSCLC患者を対象にアテゾリズマブとドセタキセルの有効性を比較したランダム化第III相OAK試験 (NCT02008227) の後向きサブグループ解析である。対象患者は、VENTANA SP142アッセイによる評価が行われた意図治療集団である SP142-ITT (n=1225) のうち、22C3アッセイによるバイオマーカー評価可能集団である 22C3-BEP (biomarker-evaluable population) (n=577) である。22C3-BEPの選択基準として、組織安定性ウィンドウが6ヶ月以内の新鮮または保存状態の良い腫瘍組織検体を有することを必須とした。アテゾリズマブ群 (n=295) とドセタキセル群 (n=282) に割り付けられた。患者背景は両群間でバランスしており、中央値年齢は63-64歳、男性比率は約62%、ECOG PS 0-1が全体の95%以上を占めていた。
PD-L1発現の評価として、VENTANA SP142アッセイ (前向き中央評価) では、腫瘍細胞 (TC) および免疫細胞 (IC) の染色比率に基づき、TC0/IC0 (1%未満、陰性)、TC1/2またはIC1/2 (1%以上50%未満、低発現)、TC1/2/3またはIC1/2/3 (1%以上、陽性)、TC3またはIC3 (TC 50%以上またはIC 10%以上、高発現) に分類した。Dako 22C3アッセイ (後向き中央評価) では、腫瘍比率スコア (TPS) を用い、TPS 1%未満 (陰性)、TPS 1%から50%未満 (低発現)、TPS 50%以上 (高発現) に分類した。
統計解析として、全体生存期間 (OS) および無増悪生存期間 (PFS) の評価にはKaplan-Meier法を用い、ハザード比 (HR) および95%信頼区間 (CI) の算出にはコックス比例ハザード回帰モデルを使用した。客観的奏効率 (ORR) の群間比較には、奏効率の差 (ΔORR) および95% CIを算出した。アッセイ間の一致率はベン図を用いて視覚化し、記述統計学的に評価した。データカットオフ日は2019年1月9日であり、中央値追跡期間は47.7ヶ月であった。本解析では、ハザード比および95%信頼区間の導出に際して、層別化されていない、調整されていないコックス回帰モデルを使用した。