- 著者: Keunchil Park, Mustafa Özgüroğlu, Johan Vansteenkiste, David Spigel, James C.-H. Yang, Marcis Bajars, Mary Ruisi, Juliane Manitz, Fabrice Barlesi
- Corresponding author: Fabrice Barlesi (Gustave Roussy Cancer Campus, Villejuif, France)
- 雑誌: Lung Cancer
- 発行年: 2021
- Epub日: N/A
- Article種別: Original Article
- PMID: 33636453
背景
進行非小細胞肺がん (NSCLC) の治療において、免疫チェックポイント阻害薬 (ICI) は重要な役割を担っている。特に、プラチナ製剤による前治療後に病勢進行した患者に対する二次治療として、複数のICIが承認され、標準治療として確立されている。アベルマブは、PD-L1を標的とするヒトIgG1抗体であり、メルケル細胞癌や尿路上皮癌などでその有効性と安全性が示されている。しかし、プラチナ既治療PD-L1陽性進行NSCLC患者を対象とした第III相JAVELIN Lung 200試験では、アベルマブとドセタキセルの比較において、主要評価項目である全生存期間 (OS) で統計学的な有意差が認められなかった (アベルマブ群 11.4か月 vs ドセタキセル群 10.3か月、ハザード比 [HR] 0.90、p > 0.05)。
JAVELIN Lung 200試験の患者登録期間 (2015年3月~2017年1月) は、ニボルマブ、ペムブロリズマブ、アテゾリズマブといった複数のICIが既治療NSCLCの標準治療として承認された時期と重なっていた。このため、ドセタキセル群の患者の多くが病勢進行後に後治療としてICIを受ける機会を得た可能性が指摘されていた。先行するNSCLC臨床試験におけるドセタキセル群での後治療ICI使用率は8~17%であったのに対し、JAVELIN Lung 200試験では26.3%と著しく高率であったことが報告されている (Table 1)。このような後治療ICIの偏った使用は、ドセタキセル群のOSを延長させ、アベルマブとドセタキセル間のOS比較を交絡させる要因となり、アベルマブの真のOSベネフィットを過小評価した可能性がある。
同様の現象は、他の腫瘍領域の臨床試験でも報告されており、試験治療後に投与される有効な薬剤がOS解析に影響を与えることが知られている。例えば、Reck et al. JClinOncol 2019によるKEYNOTE-024試験の事後解析では、化学療法群からペムブロリズマブへのクロスオーバーがOSベネフィットを減弱させたことが示されている。JAVELIN Lung 200試験における後治療ICI使用率の大きな偏りは、この交絡の影響を定量的に評価する必要性を生じさせた。本研究では、この交絡影響を詳細に分析し、アベルマブのOSに対する効果をより正確に推定することを目的とした。特に、後治療ICIの使用がOS解析に与える影響は、ICIが標準治療として確立されていく過渡期において、多くの臨床試験で共通して直面する課題であり、その解決策は今後の試験デザインにも重要な示唆を与える。このため、後治療ICIによる交絡を補正する統計学的手法を適用し、アベルマブの臨床的意義を再評価することは、未解明な部分が残されていたJAVELIN Lung 200試験の結果解釈において極めて重要である。本研究は、後治療ICIによるOS解析への交絡という課題に対し、統計学的な手法を用いてその影響を定量的に評価し、アベルマブの真の治療効果をより正確に推定することを試みる。
目的
本研究の目的は、第III相JAVELIN Lung 200試験において、後治療として投与された免疫チェックポイント阻害薬 (ICI) の使用が、主要評価項目である全生存期間 (OS) の原発解析に与えた影響を評価することである。具体的には、アベルマブ群とドセタキセル群間での後治療ICI使用の頻度と時期を比較し、後治療ICIによるOS解析への交絡を補正するための統計学的解析を実施した。この補正解析には、後治療ICI開始時に打ち切るナイーブ感度分析と、逆確率打ち切り重み付け (IPCW) 解析の2つの手法を用いた。これらの解析を通じて、後治療ICIの交絡を調整した場合のアベルマブのOSに対する真の効果を推定し、JAVELIN Lung 200試験の原発解析結果の解釈を深めることを目指した。また、後治療ICIの使用状況が患者背景因子によってどのように異なるかをサブグループ解析で検討し、交絡のメカニズムをより詳細に理解することも目的とした。最終的に、本解析結果が、ICIが利用可能となった時代の臨床試験設計におけるOS評価の課題と、その解決策としての統計学的手法の有用性を示すことを意図した。
結果
後治療ICI使用頻度: フル解析セット (n=792) において、合計120例が後治療ICIを1回以上受けていた。内訳は、アベルマブ群で16/396例 (4.0%)、ドセタキセル群で104/396例 (26.3%) であり、ドセタキセル群での後治療ICI使用率がアベルマブ群の約6.5倍と著しく高かった。PD-L1陽性集団 (n=529) では、アベルマブ群15/264例 (5.7%)、ドセタキセル群70/265例 (26.4%) であった。後治療ICIの内訳は、抗PD-1抗体が117例、抗PD-L1抗体が5例、抗CTLA-4抗体が3例であった。後治療ICI開始までの中央期間は、アベルマブ群で10.5か月 (範囲 3.9-20.4か月)、ドセタキセル群で5.7か月 (範囲 0.1-24.4か月) と、ドセタキセル群で有意に短かった。IRC評価による病勢進行後の後治療ICI開始までの中央期間も、ドセタキセル群で1.3か月 (範囲 -2.4-10.2か月) と、アベルマブ群の5.1か月 (範囲 2.3-8.1か月) より短かった。
サブグループ別後治療ICI使用率の偏り: 後治療ICIの使用率は、特定のサブグループで高くなる傾向が認められた (Table 2)。特に、非扁平上皮癌患者 (アベルマブ群4.3% vs ドセタキセル群32.1%)、ECOG PS 0の患者 (アベルマブ群6.3% vs ドセタキセル群31.3%)、早期登録ウェーブの患者 (アベルマブ群11.6% vs ドセタキセル群54.3%)、米国/西欧 (アベルマブ群2.8% vs ドセタキセル群45.5%) またはアジア (アベルマブ群11.0% vs ドセタキセル群35.4%) で登録された患者、非白人患者 (アベルマブ群10.1% vs ドセタキセル群35.0%) で、ドセタキセル群における後治療ICIの使用率が顕著に高かった。これは、試験登録時期や地域によってICIの利用可能性が異なっていたことを強く示唆する。ベースライン時の腫瘍径中央値は、後治療ICIを受けた患者でアベルマブ群50.5 mm (範囲 0.0-164.0 mm)、ドセタキセル群50.0 mm (範囲 0.0-217.0 mm) であり、後治療ICIを受けなかった患者と比較して小さかった (アベルマブ群65.0 mm、ドセタキセル群77.0 mm)。
後治療ICI使用の有無によるOS: 後治療ICIを受けた患者の、研究治療開始からのOS中央値は、アベルマブ群で23.9か月 (95% CI 14.9-29.2か月)、ドセタキセル群で19.4か月 (95% CI 15.3-21.4か月) であった。一方、後治療ICIを受けなかった患者のOS中央値は、アベルマブ群で9.9か月 (95% CI 8.6-11.7か月)、ドセタキセル群で6.8か月 (95% CI 5.6-8.5か月) であった (Fig. 1A)。PD-L1陽性集団でも同様の傾向が認められた (Fig. 1B)。後治療ICI開始時からのOS中央値 (すなわち三次治療としてのOS) は、フル解析セットでアベルマブ群10.9か月 (95% CI 5.3-14.7か月)、ドセタキセル群10.7か月 (95% CI 7.4-14.9か月) と、両群で類似していた。PD-L1陽性集団では、後治療ICI開始時からのOS中央値はアベルマブ群10.9か月 (95% CI 7.2-14.7か月)、ドセタキセル群12.6か月 (95% CI 7.5か月-推定不能) であった。
ナイーブ感度分析とIPCW調整解析: 後治療ICI開始時に打ち切るナイーブ感度分析では、フル解析セットにおけるOSのハザード比 (HR) は0.89 (95% CI 0.74-1.07) であった。PD-L1陽性集団ではHR 0.86 (95% CI 0.68-1.09) となり、原発解析のHR 0.90 (95% CI 0.73-1.11) と比較してわずかに改善したが、統計学的有意差には至らなかった。IPCW解析では、共変量として喫煙状況、登録ウェーブ、PD-L1発現状況 (80%以上のカットオフ)、組織型、ベースラインECOG PSが選択された。アベルマブ群で後治療ICIを受けた患者が少なかったため、アベルマブモデルの共変量は登録ウェーブとPD-L1発現状況に限定された。IPCW調整後のOSのハザード比は、フル解析セットで0.85 (95% CI 0.70-1.05)、PD-L1陽性集団で0.80 (95% CI 0.62-1.04) となった (Table 4)。この結果は、ナイーブ感度分析および原発解析と比較して、アベルマブのOSベネフィットがより明確に示唆されるものであった。特にPD-L1陽性集団では、95% CIの上限が1.04まで改善し、後治療ICIによる交絡を調整することで、アベルマブの臨床的意義がより強く示された。
IRCと担当医評価の進行判定の乖離: 担当医評価とIRC評価における病勢進行の分類に乖離が認められた (Table 3)。担当医が病勢進行と判断したが、IRCが病勢進行と判断しなかった患者の割合は、アベルマブ群で16.7%であったのに対し、ドセタキセル群では28.3%と高かった。この乖離は、ドセタキセル群の担当医が、後治療ICIへの切り替えを目的として、より早期に病勢進行と判断する傾向があった可能性を示唆する。
PFSと後治療ICI: 後治療ICIを受けた患者は、研究治療中のPFS (無増悪生存期間) が長期化する傾向が認められた。フル解析セットにおいて、IRC評価によるPFS中央値は、後治療ICIを受けた患者でアベルマブ群6.9か月 (95% CI 2.9-11.0か月)、ドセタキセル群5.6か月 (95% CI 4.3-6.9か月) であった。一方、後治療ICIを受けなかった患者では、アベルマブ群2.8か月 (95% CI 2.5-3.2か月)、ドセタキセル群3.2か月 (95% CI 2.7-4.2か月) であった。担当医評価によるPFS中央値は、後治療ICIを受けた患者でアベルマブ群4.0か月 (95% CI 2.6-4.4か月)、ドセタキセル群4.1か月 (95% CI 2.9-4.8か月) であり、後治療ICIを受けなかった患者ではアベルマブ群2.7か月 (95% CI 1.9-2.8か月)、ドセタキセル群2.8か月 (95% CI 2.6-3.1か月) であった。
考察/結論
本JAVELIN Lung 200試験の事後解析は、アベルマブ群4.0%に対しドセタキセル群26.3%という著しく偏った後治療ICI使用率が、原発OS解析でアベルマブの統計学的優越性を検出できなかった主要因の一つである可能性を定量的に示した。IPCW調整解析により、PD-L1陽性集団におけるOSのハザード比が0.80 (95% CI 0.62-1.04) まで改善したことは、後治療ICIによる交絡を調整した場合に、アベルマブが臨床的に意義のあるOS延長効果を持つ可能性を強く示唆する。
先行研究との違い: 本研究の結果は、Reck et al. JClinOncol 2019によるKEYNOTE-024試験の事後解析と同様に、試験治療後の有効な後治療がOS評価を交絡させる可能性を明確に示した点で、これまでの報告と一致する。しかし、JAVELIN Lung 200試験では、ドセタキセル群での後治療ICI使用率が他のICI対ドセタキセル比較試験 (Brahmer et al. NEnglJMed 2015、Borghaei et al. NEnglJMed 2015、Fehrenbacher et al. Lancet 2016、Herbst et al. Lancet 2016、Rittmeyer et al. Lancet 2017)と比較して著しく高かった点が特徴的であり、この高い使用率がOS解析への影響をより顕著にしたと考えられる。
新規性: 本研究で初めて、IPCW解析という確立された統計学的手法を用いて、JAVELIN Lung 200試験における後治療ICIのOS解析への交絡影響を定量的に評価した。この解析は、ICIが標準治療として急速に普及する過渡期に実施された臨床試験において、後治療の影響をどのように解釈すべきかという重要な課題に対する具体的な解決策を提示する点で新規性がある。特に、PD-L1陽性集団におけるHRの改善は、アベルマブが他のICIと同様のクラス効果を持つ可能性を強く示唆する。
臨床応用: 本知見は、ICIが利用可能な現在の臨床試験設計において、OSを主要評価項目とする際の重要な考慮事項を提供する。後治療による交絡を事前に想定し、IPCWのような統計的手法を用いて補正することの重要性が強調される。これにより、試験結果の解釈がより正確になり、薬剤の真の臨床的意義が評価されやすくなる。JAVELIN Lung 200試験が「ネガティブ試験」とされた結果は、必ずしもアベルマブの効果欠如を意味するものではなく、後治療ICIによる交絡という方法論的限界が影響した可能性があり、臨床現場でのアベルマブの適応判断において、本解析結果を考慮に入れるべきである。
残された課題: 今後の検討課題として、IPCW解析が共変量選択やモデル特定に依存し、重み値の極端化による推定の不安定性のリスクを伴う点が挙げられる。また、観察された効果量 (HR 0.80) も95% CIの上限が1.04であり、統計学的有意差には至っていないため、アベルマブのクラス効果を確立するためには、他のICIとの直接比較試験や、より大規模な実臨床データ (real-world evidence) での後治療ICIの影響定量化が必要である。さらに、試験設計段階で後治療を制限することの倫理的・実行可能性、および本研究が示唆する類似問題を抱える他のネガティブ試験への適用可能性も今後の研究で検討されるべきである。本研究は、OS評価における後治療交絡調整の方法論的重要性を示し、既治療NSCLCにおけるアベルマブの臨床活性の再評価を促す重要な解析である。
方法
JAVELIN Lung 200試験 (NCT02395172) は、プラチナ製剤による前治療後に病勢進行したStage IIIB/IVまたは再発NSCLC患者を対象とした、多施設共同非盲検無作為化第III相試験である。患者はアベルマブ10 mg/kgを2週間ごとに静脈内投与する群、またはドセタキセル75 mg/m²を3週間ごとに静脈内投与する群に1:1で無作為に割り付けられた。無作為化はPD-L1発現レベル (腫瘍細胞のPD-L1発現が1%以上 vs 1%未満) とNSCLCの組織型 (扁平上皮 vs 非扁平上皮) で層別化された。試験治療は、許容できない毒性、病勢進行、臨床的悪化、またはその他のプロトコル規定の離脱基準が満たされるまで継続された。ドセタキセル群からアベルマブ群へのクロスオーバーはプロトコルで許可されていなかった。本試験はヘルシンキ宣言およびICH-GCPガイドラインに従って実施され、各施設の治験審査委員会または独立倫理委員会によって承認され、全患者から書面によるインフォームドコンセントが得られた。
主要評価項目はOSであり、無作為化からあらゆる原因による死亡までの期間と定義された。副次評価項目には、RECIST version 1.1に基づき独立評価委員会 (IRC) が判定した無増悪生存期間 (PFS) が含まれた。PD-L1発現は、PD-L1 IHC 73-10アッセイを用いてベースライン時に中央で評価された。
本事後解析では、後治療ICIがOSに与える影響を評価するため、以下の統計解析が実施された。
- 後治療ICI使用の記述的解析: 各治療群における後治療ICIを1回以上受けた患者の割合、後治療開始までの期間、病勢進行後の後治療開始までの期間を比較した。サブグループ解析として、性別、組織型、ECOG PS (Eastern Cooperative Oncology Group performance status)、登録時期 (early/late wave)、人種、地域、PD-L1発現レベル別に後治療ICI使用率を評価した。
- ナイーブ感度分析: 後治療ICIを開始した時点で患者を打ち切る方法で、標準的な生存解析手法を用いてOSを評価した。この解析は、後治療ICIの使用がOSに影響を与える共変量によって影響されないと仮定するが、この仮定が満たされない場合、情報的打ち切りによるバイアスが生じる可能性がある。
- 逆確率打ち切り重み付け (IPCW) 解析: ナイーブ感度分析における情報的打ち切りによる潜在的なバイアスに対処するため、IPCW (inverse probability of censoring weighting) 解析を実施した。IPCW法は、患者データを用いて、後治療ICIが不可能であった仮想的な解析セットを作成する。打ち切られた患者を調整するため、打ち切られなかったが同様の特性を持つ残りの患者は、治療スイッチの逆確率に従って再重み付けされる。IPCW解析の実施にあたり、ベースライン人口統計学的特性、疾患関連特性、病勢進行の時間変動指標、奏効、有害事象の発生など、関連性の高い共変量を特定するために、データ駆動型の段階的変数選択手順 (Akaike情報量基準に基づく) がフル解析セットで実施された。治療スイッチまでの時間モデルは、治療群ごとに独立して適合された。このモデルに基づいて、後治療ICI前の観察値に対してIPCW重みが計算された。重み値の極端な値や集計値が1に近い平均値を持たない場合、モデルの誤指定を示す。IPCW重み値は、重み付きCox比例ハザードモデルに適用され、ハザード比 (HR) と95%信頼区間 (CI) が算出された。
これらの解析は、PD-L1陽性集団 (n=529) とフル解析セット (PD-L1陽性/陰性、n=792) の両方で実施された。