- 著者: Matthew D. Hellmann, Tudor-Eliade Ciuleanu, Adam Pluzanski, Jong-Seok Lee, Gregory A. Otterson, Clarisse Audigier-Valette, Elisa Minenza, Helena Linardou, Sjaak Burgers, Pamela Salman, Hossein Borghaei, Suresh S. Ramalingam, Julie Brahmer, Martin Reck, Kenneth J. O’Byrne, William J. Geese, George Green, Han Chang, Joseph Szustakowski, Prabhu Bhagavatheeswaran, Diane Healey, Yong Fu, Faith Nathan, Luis Paz-Ares
- Corresponding author: Matthew D. Hellmann (Memorial Sloan Kettering Cancer Center, New York, NY, USA); Luis Paz-Ares (Hospital Universitario 12 de Octubre, Madrid, Spain)
- 雑誌: New England Journal of Medicine
- 発行年: 2018
- Epub日: 2018-04-16
- Article種別: Original Article
- PMID: 29658845
背景
未治療進行非小細胞肺癌 (NSCLC) の標準治療は、プラチナ製剤併用化学療法、およびPD-L1発現レベルが50%以上の患者に対するペムブロリズマブ単剤療法であった Reck et al. NEnglJMed 2016。しかし、大部分の進行NSCLC患者に対して、より効果的な初回治療法の確立と、治療選択を導くバイオマーカーの同定が喫緊の課題として認識されていた。特に、免疫チェックポイント阻害剤 (ICI) の登場により、その効果を予測するバイオマーカーの探索が活発に行われていたが、従来のPD-L1発現のみに依存した治療選択には限界があり、新たな予測因子の探索が不足していた。
ニボルマブ (抗PD-1抗体) とイピリムマブ (抗CTLA-4抗体) の併用療法は、それぞれ異なる免疫経路を標的とすることで相補的な作用を発揮し、免疫応答を増強することが期待されていた。先行研究である第I相CheckMate 012試験では、NSCLCに対する初回治療としてニボルマブとイピリムマブの併用療法が有望な抗腫瘍活性を示し、忍容性も確認されていた。この結果は、併用免疫療法が進行NSCLCの新たな治療選択肢となる可能性を示唆するものであった。
近年、腫瘍変異負荷 (TMB) が、複数の腫瘍種においてICIの効果を予測する独立したバイオマーカーとして注目を集めていた Yarchoan et al. NEnglJMed 2017。高TMB腫瘍は、より多くのネオアンチゲンを発現し、T細胞による認識と抗腫瘍免疫応答が活性化されやすいと考えられていたためである。実際、第II相CheckMate 568試験の探索的解析では、TMBが10変異/メガベース (mut/Mb) 以上である場合に、ニボルマブとイピリムマブ併用療法による奏効が期待できる閾値として同定された。Rizvi et al. Science 2015やVanAllen et al. Science 2015などの研究も、TMBが免疫療法奏効の予測因子となりうることを示唆していた。
しかし、TMBを主要評価項目とする前向きランダム化第III相試験において、ニボルマブとイピリムマブの併用療法が化学療法と比較して無増悪生存期間 (PFS) を延長するかどうかは、まだ決定的に検証されておらず、この点が未解明な課題として残されていた。また、TMBがPD-L1発現レベルとは独立したバイオマーカーとして機能するのかという重要な臨床上の疑問も未解明であった。本研究であるCheckMate 227試験は、これらの重要な臨床的課題に答えるべく設計され、高TMBを有する進行NSCLC患者におけるニボルマブとイピリムマブ併用療法の有効性と安全性を評価することを目的とした。特に、TMBがPD-L1発現レベルと独立して治療効果を予測できるかどうかの検証は、個別化医療の観点から極めて重要であり、従来のPD-L1発現のみに依存した治療選択の限界を克服する可能性を秘めていた。
目的
本研究の目的は、CheckMate 227 (NCT02477826) Part 1において、高腫瘍変異負荷 (TMB ≥10 mut/Mb) を有する未治療のStage IVまたは再発非小細胞肺癌 (NSCLC) 患者におけるニボルマブとイピリムマブ併用療法の無増悪生存期間 (PFS) を、プラチナ製剤併用化学療法と比較して評価することであった。主要評価項目は盲検独立中央判定によるPFSであり、TMBがPD-L1発現レベルとは独立した有効性予測バイオマーカーとして機能するかどうかを検証することも重要な目的であった。
さらに、本試験では、PD-L1発現レベルに基づいた患者集団における全生存期間 (OS) も共同主要評価項目として設定されていたが、本報告では高TMB集団におけるPFSの最終解析結果に焦点を当てている。副次評価項目としては、TMBが13 mut/Mb以上かつPD-L1発現レベルが1%以上の患者におけるニボルマブ単剤療法と化学療法のPFS比較、および高TMB患者におけるニボルマブとイピリムマブ併用療法と化学療法のOS比較が含まれた。奏効割合 (ORR)、奏効期間 (DOR)、および安全性プロファイルは探索的評価項目として設定された。本研究は、TMBがNSCLCにおける免疫チェックポイント阻害剤の有効性を予測するバイオマーカーとしての役割を前向きに検証し、個別化医療の進展に貢献することを目指した。
結果
患者登録と割付: 2015年8月から2016年11月にかけて、CheckMate 227 Part 1には2877例の患者が登録され、1739例がランダムに割り付けられた。このうち、n=1649例 (94.8%) でTMB測定が試行され、n=1004例 (57.7%) で有効なTMBデータが得られた。有効なTMBデータが得られた患者のうち、444例 (44.2%) が高TMB (≥10 mut/Mb) と定義された。高TMB集団では、ニボルマブ + イピリムマブ併用療法群にn=139例、化学療法群にn=160例が割り付けられた。両群間の患者背景因子 (年齢、性別、ECOG PS、喫煙歴、組織型、PD-L1発現レベルなど) は良好にバランスが取れており (Table 1)、TMBとPD-L1発現レベルの間には相関が認められなかった (Supplementary Appendix Fig. S2)。これは、TMBがPD-L1とは独立したバイオマーカーとして機能しうるという前提を支持するものであった。
高TMB集団における主要PFS: 高TMB (≥10 mut/Mb) を有する患者集団において、ニボルマブ + イピリムマブ併用療法群は化学療法群と比較して、無増悪生存期間 (PFS) を有意に延長した。1年PFS率は、併用療法群で42.6%であったのに対し、化学療法群では13.2%であった。中央値PFSは、併用療法群で7.2ヶ月 (95% CI 5.5-13.2) vs 化学療法群で5.5ヶ月 (95% CI 4.4-5.8) であった。病勢進行または死亡のハザード比 (HR) は0.58 (97.5% CI 0.41-0.81, p<0.001) であり、統計学的に有意な差が認められた (Figure 2A)。この結果は、共同主要評価項目の一つである高TMB集団におけるPFS延長の仮説を支持するものであった。
多変量解析によるPFSの一貫性: 事前規定された多変量Cox解析においても、高TMB集団におけるニボルマブ + イピリムマブ併用療法のPFSに対する治療効果は、主要解析と一貫していた。ベースラインのPD-L1発現レベル (≥1% vs <1%)、性別、腫瘍組織型 (扁平上皮癌 vs 非扁平上皮癌)、ECOG PS (0 vs ≥1) を共変量として調整した後も、ハザード比は0.57 (97.5% CI 0.40-0.80, p<0.001) であり、併用療法の優位性が確認された。
奏効の深度と持続性: 客観的奏効割合 (ORR) は、ニボルマブ + イピリムマブ併用療法群で45.3% (63/139例, 95% CI 36.9-54.0) であったのに対し、化学療法群では26.9% (43/160例, 95% CI 20.2-34.4) であった (Table 2)。完全奏効 (CR) は併用療法群で3.6% (5例)、化学療法群で0.6% (1例) であり、部分奏効 (PR) はそれぞれ41.7% (58例) と26.2% (42例) であった。奏効発現までの中央値期間は、併用療法群で2.7ヶ月、化学療法群で1.5ヶ月であった。奏効持続期間 (DOR) 中央値は、併用療法群では未到達 (範囲 2.1-20.5+ヶ月) であったのに対し、化学療法群では5.4ヶ月 (範囲 2.6-18.1+ヶ月) であった。1年時点での奏効維持率は、併用療法群で68%と高かったのに対し、化学療法群では25%と顕著な差が認められた (Figure 2B)。
PD-L1発現サブグループ解析: 高TMB集団において、PD-L1発現レベルに基づくサブグループ解析が実施された。PD-L1発現レベルが1%以上の患者群および1%未満の患者群のいずれにおいても、ニボルマブ + イピリムマブ併用療法は化学療法と比較してPFSの延長を示した (Figure 3A)。PD-L1 <1%群でのHRは0.48 (95% CI 0.27-0.85) であった。この結果は、TMBがPD-L1発現レベルとは独立して、ニボルマブ + イピリムマブ併用療法の効果を予測するバイオマーカーとして妥当であることを裏付けるものであった。同様に、組織型サブグループ (扁平上皮癌および非扁平上皮癌) においても、併用療法の一貫した効果が観察された (Figure 3B)。
低TMB集団におけるPFS: TMBが10 mut/Mb未満の低TMB集団では、ニボルマブ + イピリムマブ併用療法群の中央値PFSは3.2ヶ月 (95% CI 2.7-4.3) であったのに対し、化学療法群では5.5ヶ月 (95% CI 4.3-5.6) であった。この群間差は統計学的に有意ではなく (HR 1.07, 95% CI 0.84-1.35)、高TMBカットオフ値10 mut/Mbの臨床的妥当性が、高TMB患者におけるベネフィットと低TMB患者における非ベネフィットの両面から支持された。
ニボルマブ単剤療法との比較: 副次評価項目として、TMBが13 mut/Mb以上かつPD-L1発現レベルが1%以上の患者集団 (ニボルマブ単剤群n=71例 vs 化学療法群n=79例) におけるニボルマブ単剤療法と化学療法のPFSが比較された。この集団では、ニボルマブ単剤療法の中央値PFSは4.2ヶ月 (95% CI 2.7-8.3) であったのに対し、化学療法群では5.6ヶ月 (95% CI 4.5-7.0) であり、有意な差は認められなかった (HR 0.95, 97.5% CI 0.61-1.48, p=0.78)。また、高TMB (≥10 mut/Mb) かつPD-L1発現レベルが1%以上の患者集団では、ニボルマブ + イピリムマブ併用療法の中央値PFSは7.1ヶ月 (95% CI 5.5-13.5) であったのに対し、ニボルマブ単剤療法では4.2ヶ月 (95% CI 2.6-8.3) であり、併用療法が単剤療法よりも優越する傾向が示された (HR 0.75, 95% CI 0.53-1.07)。
安全性プロファイル: グレード3または4の治療関連有害事象 (AE) の発生率は、ニボルマブ + イピリムマブ併用療法群で31.2%であったのに対し、化学療法群では36.1%であり、併用療法群で低率であった (Table 3)。治療関連AEによる治療中止率は、併用療法群で17.4%と化学療法群の8.9%より高かったが、併用療法群の治療継続期間中央値は4.2ヶ月と化学療法群の2.6ヶ月より長かった。免疫関連の主要な選択的AEとしては、併用療法群で皮膚反応が33.9%、ニボルマブ単剤療法群で20.7%に認められた。グレード3または4の肝イベントは、併用療法群で8.0%に発生した。治療関連死は、併用療法群で7例 (1.2%)、化学療法群で6例 (1.1%)、ニボルマブ単剤療法群で2例 (0.5%) であった。
考察/結論
CheckMate 227 Part 1試験は、高腫瘍変異負荷 (TMB ≥10 mut/Mb) を有する進行非小細胞肺癌 (NSCLC) 患者において、ニボルマブとイピリムマブの併用療法がプラチナ製剤併用化学療法と比較して、無増悪生存期間 (PFS) を有意に延長することを、前向きランダム化第III相試験として初めて決定的に示した画期的な研究である。ハザード比 (HR) は0.58 (97.5% CI 0.41-0.81, p<0.001) であり、1年PFS率は併用療法群で42.6%に対し、化学療法群では13.2%と顕著な差が認められた。
新規性: 本研究で初めて、TMBがPD-L1発現レベルとは独立した有効性予測バイオマーカーとして、前向きランダム化第III相試験で検証されたことは極めて新規性の高い知見である。TMBとPD-L1発現レベルの間に相関が認められず、高TMB集団においてPD-L1発現レベルにかかわらず併用療法の効果が一貫していたことは、TMBが新たな患者選択基準となりうることを明確に示した。また、CheckMate 568試験で探索的に同定された10 mut/MbというTMBカットオフ値の臨床的妥当性が、低TMB群における非ベネフィット (HR 1.07, 95% CI 0.84-1.35) と合わせて双方向的に支持された点も重要である。
先行研究との違い: これまでのNSCLCの免疫療法ではPD-L1発現が主要なバイオマーカーとされてきたが、本研究はTMBがPD-L1とは異なるメカニズムで免疫療法の効果を予測しうることを示した点で、従来の知見と対照的である。ニボルマブ単剤療法がTMB高値かつPD-L1高値の患者で化学療法と比較して有意なPFS延長を示さなかったこと (HR 0.95, 97.5% CI 0.61-1.48, p=0.78) は、ニボルマブとイピリムマブの併用療法特有のベネフィットが高TMB患者で発揮されることを示唆しており、単剤療法とは異なる作用機序の重要性を強調するものである。
臨床応用: 本試験結果は、ドライバー遺伝子変異陰性NSCLCにおける化学療法フリーの初回治療として、ニボルマブとイピリムマブの併用療法が有効な選択肢となりうることを確立した。特に、奏効の深さ (CR 3.6% vs 0.6%) と持続性 (1年奏効維持率68% vs 25%) が顕著であったことは、長期的な病勢コントロールが期待できることを示唆し、臨床的意義は大きい。この知見は、2020年の米国食品医薬品局 (FDA) によるニボルマブ + イピリムマブ ± 化学療法併用療法の承認 (CheckMate 9LA試験に基づく) の基盤の一つとなり、進行NSCLCの治療パラダイムに大きな影響を与えた。
残された課題: 今後の検討課題として、本報告では示されていない最終的な全生存期間 (OS) の結果がTMB特異的な利益をどの程度反映するか、また、FoundationOne CDxアッセイに特有のTMB定量特性が他のプラットフォームにどの程度移植可能かという点が残されている。TMB検査の実臨床における可及性やコスト、および高TMBの定義の標準化も今後の課題である。さらに、免疫療法と化学療法の併用療法との比較や、最適な治療シーケンスについてもさらなる研究が必要である。本研究は、腫瘍免疫バイオマーカー時代の幕開けを象徴する研究であり、以後のKEYNOTE-158試験 (TMBがペムブロリズマブの承認拡大の根拠となった) やCheckMate 568試験の位置づけにも影響を与えた。
方法
本研究は、多施設共同オープンラベル多パート第III相ランダム化比較試験であるCheckMate 227 (NCT02477826) のPart 1として実施された。対象患者は、組織学的に扁平上皮癌または非扁平上皮癌と診断されたStage IVまたは再発NSCLC患者で、ECOG Performance Status (PS) が0または1であり、以前に全身抗がん治療を受けていない者、およびEGFR遺伝子変異またはALK融合遺伝子転座が陰性である者であった。既知の自己免疫疾患や未治療の中枢神経系転移を有する患者は除外された。
患者は、腫瘍のPD-L1発現レベルに基づいて層別化された。PD-L1発現レベルが1%以上の患者は、ニボルマブ (3 mg/kg、2週ごと) + イピリムマブ (1 mg/kg、6週ごと) 併用療法、ニボルマブ単剤療法 (240 mg、2週ごと)、またはプラチナ製剤併用化学療法のいずれかに1:1:1の割合でランダムに割り付けられた。PD-L1発現レベルが1%未満の患者は、ニボルマブ + イピリムマブ併用療法、ニボルマブ + 化学療法、または化学療法のいずれかに1:1:1の割合でランダムに割り付けられた。化学療法は、組織型に応じてペメトレキセドとシスプラチンまたはカルボプラチン (非扁平上皮癌)、あるいはゲムシタビンとシスプラチンまたはカルボプラチン (扁平上皮癌) が用いられ、最大4サイクル実施された。
腫瘍変異負荷 (TMB) は、FoundationOne CDxアッセイを用いて測定された。これは、体細胞のコーディング領域における塩基置換および短い挿入・欠失 (indel) の数をゲノムのメガベースあたりで算出したものである。測定領域は0.8 Mbであり、TMBは「変異数/0.8 Mb」として算出された。TMBが10 mut/Mb以上である場合を「高TMB」と定義し、主要評価項目であるニボルマブ + イピリムマブ併用療法と化学療法のPFS比較の対象集団とした。このカットオフ値は、CheckMate 568試験の探索的解析に基づいて事前に規定された。
共同主要評価項目は、高TMB集団におけるニボルマブ + イピリムマブ併用療法と化学療法のPFS (盲検独立中央判定による) および、PD-L1発現レベル別の患者集団におけるOSであった。本報告では、PFSの最終解析結果 (データベースロック日: 2018年1月24日) が示されている。統計解析計画では、高TMB患者n=265例、イベント数221件を想定し、ハザード比 (HR) 0.66を検出する検出力80%、両側αエラー0.025で設計された。PFSの推定にはカプラン・マイヤー (Kaplan-Meier) 法が用いられ、群間比較には非層別Cox比例ハザードモデルが適用された。多変量解析も事前に規定され、ベースラインのPD-L1発現レベル、性別、組織型、ECOG PSを共変量として調整した。安全性評価は、NCI Common Terminology Criteria for Adverse Events (CTCAE) version 4.0に基づいて行われた。