- 著者: D.P. Carbone, M. Reck, L. Paz-Ares, et al.
- Corresponding author: D.P. Carbone (Ohio State University, Columbus, USA)
- 雑誌: New England Journal of Medicine
- 発行年: 2017
- Epub日: 2017-06-22
- Article種別: Original Article
- PMID: 28636851
背景
進行非小細胞肺がん (NSCLC) の一次治療において、過去20年間プラチナ製剤併用化学療法が標準治療であった。しかし、化学療法は奏効期間が限定的であり、安全性プロファイルも十分とは言えなかった。これまでの第III相臨床試験では、プラチナ製剤併用化学療法の無増悪生存期間 (PFS) 中央値は4~6ヶ月、全生存期間 (OS) 中央値は10~13ヶ月と報告されている Scagliotti et al. JClinOncol 2008、Socinski et al. JClinOncol 2012、Patel et al. JClinOncol 2013、Thatcher et al. LancetOncol 2015。
ニボルマブは、既治療の進行NSCLC患者において、ドセタキセルと比較してOSを有意に延長することが示され (CheckMate 017および057試験)、二次治療として承認されていた Brahmer et al. NEnglJMed 2015、Borghaei et al. NEnglJMed 2015。特に、PD-L1発現レベルが高い患者では、その効果が増強される傾向が認められた。未治療NSCLC患者を対象とした第I相CheckMate 012試験の予備データでは、PD-L1発現レベル5%以上の患者においてニボルマブ単剤療法が有望な客観的奏効率 (ORR) 50%、PFS中央値10.6ヶ月を示し、良好な安全性プロファイルが確認されていた Gettinger et al. JClinOncol 2016。この結果に基づき、PD-L1発現レベル5%以上の患者集団がニボルマブによるPFS延長効果を示す可能性が高いと考えられ、主要評価項目集団として設定された。
同時期に実施されたKEYNOTE-024試験では、ペムブロリズマブがPD-L1腫瘍細胞発現率 (TPS) 50%以上の患者の一次治療において、化学療法を上回るPFSおよびOSの延長を示すことが報告され、PD-L1発現が免疫チェックポイント阻害薬の効果予測バイオマーカーとして注目された Reck et al. NEnglJMed 2016。しかし、PD-L1発現レベルと免疫チェックポイント阻害薬の効果との関連性、特にPD-L1発現レベルが低い患者における効果については、依然として未解明な点が多く、より広範なPD-L1発現レベルの患者集団におけるニボルマブの有効性を検証する必要があった。また、PD-L1以外のバイオマーカー、例えば腫瘍変異負荷 (TMB) と免疫チェックポイント阻害薬の奏効との関連性も探索的に検討されており、高TMBが免疫原性を高め、抗腫瘍免疫応答を誘導する可能性が示唆されていた Rizvi et al. Science 2015。
本研究であるCheckMate 026試験は、PD-L1発現レベル1%以上の未治療進行NSCLC患者を対象に、一次治療としてのニボルマブ単剤療法の有効性と安全性をプラチナ製剤併用化学療法と比較することを目的とした。特に、PD-L1発現レベル5%以上の患者集団におけるPFS優越性の検証を主要評価項目とし、PD-L1発現レベルがより低い患者集団やTMBに基づく探索的解析も実施することで、免疫チェックポイント阻害薬の一次治療における適切な患者選択基準を確立するための重要な知見を提供することが期待された。
目的
PD-L1腫瘍細胞発現レベル1%以上の未治療Stage IVまたは再発非小細胞肺がん (NSCLC) 患者を対象に、ニボルマブ単剤療法とプラチナ製剤併用化学療法の有効性および安全性を比較することを目的とした。主要評価項目は、PD-L1発現レベル5%以上の患者集団における盲検下独立中央判定による無増悪生存期間 (PFS) の優越性を検証することであった。副次評価項目として、PD-L1発現レベル5%以上の患者集団および全無作為化患者集団における全生存期間 (OS)、客観的奏効率 (ORR)、奏効持続期間、安全性プロファイルを評価した。さらに、探索的評価項目として、腫瘍変異負荷 (TMB) が治療アウトカムに与える影響を解析し、ニボルマブの有効性を予測する新たなバイオマーカーの可能性を検討した。本研究は、一次治療における免疫チェックポイント阻害薬の適切な患者選択基準を確立するための重要な知見を提供することを目指した。
結果
主要評価項目(PD-L1発現レベル5%以上集団のPFS)の不達成: PD-L1発現レベル5%以上の患者423例における主要評価項目であるPFS中央値は、ニボルマブ群で4.2ヶ月 (95% CI, 3.0-5.6) であったのに対し、化学療法群では5.9ヶ月 (95% CI, 5.4-6.9) であり、ニボルマブ単剤療法は化学療法と比較してPFSを有意に延長しなかった (HR 1.15; 95% CI, 0.91-1.45; P=0.25)。この結果は、ニボルマブの優越性が証明されなかったことを示している。ベースライン特性において、化学療法群ではPD-L1発現レベル50%以上の患者の割合がニボルマブ群よりも高かった (47% vs 32%) こと、また女性患者の割合が化学療法群で高かった (45% vs 32%) ことなど、治療効果に影響を及ぼしうる不均衡が認められた。さらに、ニボルマブ群では肝転移の割合がわずかに高く (20% vs 13%)、腫瘍径の合計中央値も大きかった (82 mm vs 68 mm)。これらの不均衡が主要評価項目の結果に影響を与えた可能性が指摘された。
全生存期間 (OS) および客観的奏効率 (ORR): PD-L1発現レベル5%以上の患者集団におけるOS中央値は、ニボルマブ群で14.4ヶ月 (95% CI, 11.7-17.4) であったのに対し、化学療法群では13.2ヶ月 (95% CI, 10.7-17.1) であり、両群間で統計学的に有意な差は認められなかった (HR 1.02; 95% CI, 0.80-1.30)。化学療法群の患者128例中60%が、病勢進行後にニボルマブを後続治療として受けたことが、OS解析における両群間の差を不明瞭にした可能性が考えられる。ORRはニボルマブ群で26% (95% CI, 20-33) であったのに対し、化学療法群では33% (95% CI, 27-40) と化学療法群の方が高かった。しかし、奏効持続期間中央値はニボルマブ群で12.1ヶ月 (95% CI, 1.7-19.4+) と、化学療法群の5.7ヶ月 (95% CI, 1.4-21.0+) と比較して顕著に長く、ニボルマブの持続的な奏効が示された (Table 2)。
PD-L1サブグループ解析: PD-L1発現レベル50%以上のサブグループ (ニボルマブ群n=88、化学療法群n=126) においても、ニボルマブのPFS優越性は認められなかった (HR 1.07; 95% CI, 0.77-1.49)。全無作為化患者集団 (PD-L1発現レベル1%以上、n=541) においても、PFSおよびOSに関して同様にニボルマブの優越性は示されなかった (Figure 1A, 1B)。この結果は、PD-L1発現レベル50%以上でペムブロリズマブが化学療法に優越したKEYNOTE-024試験の結果と対照的であった。CheckMate 026試験では、PD-L1発現レベル50%以上の患者数がニボルマブ群で化学療法群よりも少なかった (32% vs 47%) ことも、このサブグループ解析の結果に影響を与えた可能性がある。
探索的腫瘍変異負荷 (TMB) 解析: 全エクソームシークエンスによりTMBが評価された312例の患者を対象とした探索的解析では、高TMB群 (243変異/Mb以上、全体の約28%) においてニボルマブの有望な効果が示唆された。高TMB群におけるORRはニボルマブ群で47%であったのに対し、化学療法群では28%であった。PFS中央値はニボルマブ群で9.7ヶ月 (95% CI, 5.1-NR) と、化学療法群の5.8ヶ月 (95% CI, 4.2-8.5) と比較して長く、病勢進行または死亡のリスクが有意に低い傾向が認められた (HR 0.62; 95% CI, 0.38-1.00) (Figure 2C)。一方、低・中TMB群では化学療法が優る傾向が示された (PFS HR 1.82; 95% CI, 1.30-2.55)。TMBとPD-L1発現レベルの間には有意な相関は認められなかった (Pearsonの相関係数 = 0.059)。高TMBかつPD-L1発現レベル50%以上の患者群では、ニボルマブの奏効率が75%とさらに高かったが、この比較は統計解析の検出力を持つものではなかった。化学療法群の高TMB患者の68%が後続治療としてニボルマブを受けたため、OS解析ではTMBに関わらず両群間で差は認められなかった。
安全性プロファイル: 治療関連有害事象 (全グレード) は、ニボルマブ群で71%の患者に発生したのに対し、化学療法群では92%の患者に発生した。グレード3または4の治療関連有害事象は、ニボルマブ群で18%であったのに対し、化学療法群では51%と顕著に高かった (Table 3)。治療関連の重篤な有害事象の発生率は両群で同程度であった。治療中止に至った治療関連有害事象は、ニボルマブ群で10%、化学療法群で13%であった。ニボルマブに関連する主な免疫関連有害事象は、皮疹、内分泌障害、肺臓炎などであった。治療関連死はニボルマブ群で2例 (多臓器不全、肺臓炎各1例)、化学療法群で3例 (敗血症1例、発熱性好中球減少症2例) 報告された。全体として、ニボルマブは化学療法と比較して良好な安全性プロファイルを示し、新たな安全性シグナルは認められなかった。
考察/結論
CheckMate 026試験は、PD-L1発現レベル5%以上の未治療進行NSCLC患者において、一次治療としてのニボルマブ単剤療法がプラチナ製剤併用化学療法と比較してPFSを有意に延長しなかったという、重要なネガティブ試験である。OSも両群間で同程度であった。この結果は、同時期に発表されたKEYNOTE-024試験で、PD-L1発現レベル50%以上の患者においてペムブロリズマブが化学療法に優越した結果と対照的であり、PD-L1カットオフ値の設定が免疫チェックポイント阻害薬の一次治療における有効性を決定する上で極めて重要であることを示唆している。
本試験の主要評価項目不達成の要因として、いくつかの点が考えられる。第一に、ベースライン特性の不均衡が挙げられる。化学療法群ではPD-L1発現レベル50%以上の患者の割合がニボルマブ群よりも高く (47% vs 32%)、また女性患者の割合も高かった (45% vs 32%)。これらの因子は、一般的に良好な予後と関連するとされており、化学療法群に有利に働いた可能性がある。第二に、化学療法群における高頻度のクロスオーバー (60%の患者が病勢進行後にニボルマブを投与) が、OS解析における両群間の差を不明瞭にしたと考えられる。第三に、PD-L1発現レベル5%以上というカットオフ値が、ニボルマブ単剤療法で明確な優越性を示すには低すぎた可能性が指摘される。KEYNOTE-024試験の成功は、PD-L1発現レベル50%以上というより厳格な選択基準が奏功したことを示している。
しかし、本研究の最も重要な知見は、探索的腫瘍変異負荷 (TMB) 解析から得られたものである。高TMB群 (243変異/Mb以上) において、ニボルマブは化学療法と比較してORRが高く (47% vs 28%)、PFSも有意に延長する傾向が示された (HR 0.62; 95% CI, 0.38-1.00)。この結果は、TMBがPD-L1とは独立した免疫チェックポイント阻害薬の奏効予測バイオマーカーとして機能する可能性を新規に示唆するものであり、後のCheckMate 227試験 (高TMBの一次治療においてニボルマブとイピリムマブの併用療法が化学療法に優越) の設計へとつながった。この知見は、免疫チェックポイント阻害薬の臨床応用において、PD-L1とTMBの両方を考慮した患者選択の重要性を示すものである。
残された課題として、TMB解析が探索的なものであり、事前に規定されたものではなかったため、その結果は仮説生成的なものとして、今後の前向き検証が必要である。また、PD-L1発現レベルとTMBの組み合わせによる効果予測についても、本研究では統計的検出力が不足しており、さらなる検討が求められる。本試験は、一次治療における免疫チェックポイント阻害薬の適切な患者選択の複雑性を示し、バイオマーカーに基づく個別化医療の重要性を再認識させるものであった。
方法
CheckMate 026は、国際共同非盲検無作為化第III相試験 (NCT02041533) として実施された。対象患者は、組織学的に確認されたStage IVまたは再発NSCLC患者で、PD-L1腫瘍細胞発現レベルが1%以上 (Dako 28-8抗体を用いて中央検査室で評価)、EGFR遺伝子変異またはALK転座陰性、ECOGパフォーマンスステータス0または1、測定可能病変を有する患者であった。過去に進行・転移性疾患に対する全身性抗がん治療歴のある患者は除外された。脳転移を有する患者は、適切に治療され、無症状であれば登録可能であった。
患者はニボルマブ群 (3 mg/kgを2週間ごとに静脈内投与) または主治医が選択するプラチナ製剤併用化学療法群 (3週間ごとに最大6サイクル投与) に1:1の割合で無作為に割り付けられた。化学療法群の患者は、病勢進行時にニボルマブへのクロスオーバーが許容された。無作為化はPD-L1発現レベル (<5% vs. ≥5%) および腫瘍組織型 (扁平上皮癌 vs. 非扁平上皮癌) で層別化された。
主要評価項目は、PD-L1発現レベル5%以上の患者集団における盲検下独立中央判定 (BICR) によるPFSであった。副次評価項目には、PD-L1発現レベル5%以上の患者集団および全無作為化患者集団におけるOS、ORR、奏効持続期間、安全性プロファイルが含まれた。腫瘍評価はRECIST version 1.1に基づき、48週目までは6週間ごと、その後は12週間ごとに実施された Eisenhauer et al. EurJCancer 2009。有害事象はNCI-CTCAE version 4.0に従って評価された。
探索的バイオマーカー解析として、全エクソームシークエンスにより腫瘍変異負荷 (TMB) が評価された。TMBはベースライン腫瘍検体における体細胞ミスセンス変異の総数と定義され、患者はTMBの低、中、高の3群に分類された (高TMBは243変異/Mb以上と定義)。TMB解析は探索的なものであり、事前に規定されたものではなかった。
統計解析では、主要評価項目であるPD-L1発現レベル5%以上の患者集団のPFSについて、ログランク検定を用いてニボルマブの優越性を評価するよう設計された。ハザード比 (HR) と95%信頼区間 (CI) は層別Cox比例ハザードモデルを用いて推定された。生存曲線はカプラン・マイヤー法により推定された。奏効率の比較には層別Cochran-Mantel-Haenszel検定が用いられた。