• 著者: Zinner RG, Obasaju CK, Spigel DR, Weaver RW, Beck JT, Waterhouse DM, Modiano MR, Hrinczenko B, Nikolinakos PG
  • Corresponding author: Ralph G. Zinner, MD (University of Texas M.D. Anderson Cancer Center, Houston, TX)
  • 雑誌: Journal of Thoracic Oncology
  • 発行年: 2015
  • Epub日: 2014-11-03
  • Article種別: Original Article
  • PMID: 25371077

背景

進行非扁平上皮非小細胞肺癌 (NSCLC) の一次治療において、プラチナ製剤併用化学療法は標準治療として確立されている。特に、ECOG 4599試験 (Sandler et al. NEnglJMed 2006) では、パクリタキセル (Pac) + カルボプラチン (Cb) + ベバシズマブ (Bev) 併用療法が全生存期間 (OS) の有意な改善 (中央値 12.3ヶ月 vs 10.3ヶ月、ハザード比 [HR] 0.79) を示し、ベバシズマブ適格患者に対する標準治療の一つとして広く採用された。一方、ペメトレキセド (Pem) は、非扁平上皮NSCLCにおいてその有効性が複数の大規模臨床試験で示されている。例えば、Scagliotti et al. JClinOncol 2008 の第III相試験では、ペメトレキセド + シスプラチンが非扁平上皮NSCLC患者のOSを有意に延長することを示した (HR 0.84)。また、ペメトレキセド維持療法も、PARAMOUNT試験 (Paz-Ares et al. JClinOncol 2013) や Ciuleanu et al. Lancet 2009 の研究において、無増悪生存期間 (PFS) およびOSの改善効果が確認され、維持療法の有効性が確立された。

米国では、シスプラチンよりもカルボプラチンをベースとしたレジメンが実臨床でより頻繁に用いられており、ペメトレキセド + カルボプラチン (Pem+Cb) 療法も広く普及していた。しかし、Pac+Cb+Bev 導入後にベバシズマブ維持療法を行うレジメンと、Pem+Cb 導入後にペメトレキセド維持療法を行うレジメンとの直接比較試験はこれまで実施されておらず、両者の相対的な有効性および安全性プロファイルを客観的に評価する必要性が臨床的に強く求められていた。特に、両レジメンが同程度の有効性を示す場合、患者の生活の質 (QOL) や治療継続性にとって毒性プロファイルの差異が重要な選択基準となるため、この点に関する詳細な比較データが不足していた。この点が、これまでの研究で残された課題であった。

PRONOUNCE試験は、PointBreak試験 (Patel et al. JClinOncol 2013) と同様の設計基準を持つ「支持的試験」として計画された。本試験の独自性は、主要評価項目として「グレード4毒性なしの無増悪生存期間 (G4PFS)」という複合エンドポイントを採用した点にある。これは、有効性が同等であるならば、より毒性の少ない治療法が優れているという「Quality-adjusted efficacy」の概念を検証する試みであった。このアプローチは、非治癒的な進行がん治療において、生存期間の延長だけでなく、治療関連毒性による患者負担の軽減も重視されるべきであるという臨床的ニーズを反映している。USの実臨床においてカルボプラチン系レジメンが多用される背景から、本試験の設計は米国における治療実態を反映したものとなっている。

目的

本PRONOUNCE試験の主要目的は、進行非扁平上皮NSCLC患者において、一次治療としてArm A (ペメトレキセド + カルボプラチン導入後、ペメトレキセド維持療法) とArm B (パクリタキセル + カルボプラチン + ベバシズマブ導入後、ベバシズマブ維持療法) のG4PFS (グレード4毒性なしの無増悪生存期間) を比較し、Arm Aが主要エンドポイントにおいて優越性を示すという仮説を検証することであった。

副次目的としては、両治療群間における無増悪生存期間 (PFS)、全生存期間 (OS)、客観的奏効率 (ORR)、病勢コントロール率 (DCR) の比較評価、および各治療レジメンの安全性プロファイルと医療資源利用状況の評価が含まれた。これらの評価を通じて、両レジメンの有効性と安全性を多角的に分析し、進行非扁平上皮NSCLC患者に対する最適な一次治療選択のためのエビデンスを確立することを目指した。特に、G4PFSという複合エンドポイントを用いることで、有効性と毒性のバランスを考慮した治療選択の指針を提供することが期待された。

結果

患者背景と治療状況: 無作為化された患者のベースライン特性は、両治療群間でバランスが取れていた (Table 1)。年齢中央値は65.6歳 (範囲 38.4-86.2歳) で、女性が約42%、白色人種が89.2%を占めた。腺癌の割合はArm Aで83.5%、Arm Bで76.5%であった。ECOG PS 0の患者は約47%であった。治療サイクル中央値は両群ともに6サイクルであり、4サイクル完遂率はArm Aで70.8%、Arm Bで68.1%とほぼ同等であった。平均用量強度は、ペメトレキセド 92.3%、カルボプラチン 94.1% (Arm A)、パクリタキセル 91.5%、カルボプラチン 92.8%、ベバシズマブ 93.3% (Arm B) と、いずれの薬剤も高値で維持された。

G4PFS (主要エンドポイント) の評価: ITT集団において、G4PFSイベントは合計296件発生し、Arm Aで152件、Arm Bで144件であった。G4PFS中央値は、Arm Aで3.91ヶ月、Arm Bで2.86ヶ月であり、ハザード比 (HR) 0.85 (90% CI 0.70-1.04, p=0.176) であった (Figure 2A)。この結果は、主要エンドポイントにおいて統計的有意差を示さず、Pem+CbがPac+Cb+Bevに対してG4PFSで優越性を示すという仮説は棄却された。G4PFSイベントの内訳は、グレード4有害事象が101件 (34.1%)、疾患進行が163件 (55.1%)、死亡が32件 (10.8%) であった (Table 2)。最も頻繁に観察されたG4PFS毒性は、好中球減少症、血小板減少症、血栓塞栓症であった。

無増悪生存期間 (PFS) および全生存期間 (OS) の比較: PFS中央値は、Arm Aで4.44ヶ月、Arm Bで5.49ヶ月であり、HR 1.06 (95% CI 0.84-1.35, p=0.610) であった (Figure 2B)。両群間でPFSに統計的有意差は認められず、数値上はArm Bが僅かに長い傾向を示した。OS中央値は、Arm Aで10.5ヶ月、Arm Bで11.7ヶ月であり、HR 1.07 (95% CI 0.83-1.36, p=0.615) であった (Figure 2C)。OSにおいても両群間に統計的有意差は認められなかった。1年生存率はArm Aで43.7%、Arm Bで48.8%であり、2年生存率はArm Aで18.0%、Arm Bで17.6%であった。長期的な生存率では両群が収束し、実質的に同等の予後を示した。

客観的奏効率 (ORR) および病勢コントロール率 (DCR) の評価: 客観的奏効率 (ORR) は、Arm Aで23.6%、Arm Bで27.4%であり (p=0.414)、病勢コントロール率 (DCR) は、Arm Aで59.9%、Arm Bで57.0%であった (p=0.575)。いずれの評価項目においても、両群間に統計的有意差は認められなかった。

安全性プロファイルの差異: 両治療群間で、薬剤関連のグレード3/4毒性プロファイルには顕著な差異が認められた (Table 3)。

  • 貧血: Arm Aで18.7% vs Arm Bで5.4% (p<0.001) と、Arm Aで有意に高頻度であった。赤血球輸血の必要性もArm Aで35.7% vs Arm Bで12.7% (p<0.001) と、Arm Aで顕著に高かった。
  • 血小板減少症: Arm Aで24.0% vs Arm Bで9.6% (p<0.001) と、Arm Aで有意に高頻度であった。
  • 好中球減少症: Arm Aで24.6% vs Arm Bで48.8% (p<0.001) と、Arm Bで有意に高頻度であった。
  • 脱毛症 (グレード1/2): Arm Aで8.2% vs Arm Bで28.3% (p<0.001) と、Arm Bで有意に高頻度であった。
  • 感覚神経障害 (グレード1): Arm Aで7.6% vs Arm Bで21.7% (p<0.001) と、Arm Bで有意に高頻度であった。
  • 悪心 (グレード1): Arm Aで29.8% vs Arm Bで15.7% (p=0.003) と、Arm Aで有意に高頻度であった。
  • 血栓塞栓症 (グレード3/4): Arm Aで0% vs Arm Bで2.4%と、Pac+Cb+Bev群で発生が認められたが、統計的有意差はなかった。 治療関連死は、Arm Aで1例 (好中球減少関連)、Arm Bで2例 (心筋梗塞、肺塞栓) であった。入院件数および入院期間に両群間で有意差は認められなかった (Arm A: 34.5% vs Arm B: 31.9%, p=0.645; 平均入院日数 Arm A: 8.2日 vs Arm B: 8.8日, p=0.682)。

サブグループ解析および二次治療の状況: サブグループ解析 (Figure 3A, 3B) では、G4PFSおよびOSに関して、いずれのサブグループにおいても一方の治療を明確に支持する結果は得られなかった。治療中止後の二次治療の利用率は両群間で類似していた (Arm A: 47.3% vs Arm B: 52.5%, p=0.344)。二次治療の内容には差異があり、Arm Aの患者ではドセタキセル (docetaxel) の使用が有意に多く (26.4% vs 6.1%, p<0.001)、Arm Bの患者ではペメトレキセドの使用が有意に多かった (8.8% vs 34.1%, p<0.001)。

考察/結論

主要結果の解釈と試験デザインの意義: PRONOUNCE試験は、進行非扁平上皮NSCLCの一次治療において、Pem+Cb維持療法がPac+Cb+Bev維持療法と比較して、主要評価項目であるG4PFS (HR 0.85, 90% CI 0.70-1.04, p=0.176) で優越性を示すという仮説を達成できなかった。PFS (HR 1.06, 95% CI 0.84-1.35, p=0.610) およびOS (HR 1.07, 95% CI 0.83-1.36, p=0.615) も両群間で統計的に有意な差はなく、ORRやDCRも同等であった。この結果は、両レジメンの有効性が実質的に同等であることを示唆している。G4PFSという複合エンドポイントの採用は、有効性が同等である場合に毒性の少ない治療法が優れるという「Quality-adjusted efficacy」の概念を検証するものであったが、Pem+Cb群で貧血 (18.7%) や血小板減少症 (24.0%) といった血液毒性が高頻度に発生し、これらがG4PFSイベントとして計上されたことが、両群間でG4PFSに有意差が認められなかった一因であると考えられる。特に、Pem+Cb群での赤血球輸血必要率が35.7%と高かったことは、この血液毒性の臨床的影響の大きさを物語っている。

「同等の有効性・異なる毒性」の臨床的含意: 本試験の最も重要な知見は、Pem+CbとPac+Cb+Bevという二つの標準レジメンが、有効性 (mOS 10.5ヶ月 vs 11.7ヶ月、ORR 23.6% vs 27.4%) において実質的に同等である一方で、毒性プロファイルが大きく異なるという点である。Pem+Cb群では貧血、血小板減少症といった血液毒性が顕著であり、輸血の必要性が高かった。一方、Pac+Cb+Bev群では好中球減少症 (48.8%)、脱毛症 (28.3%)、感覚神経障害がより高頻度であった。この対照的な毒性プロファイルは、個々の患者の併存疾患、既存の毒性、およびQOLへの懸念に基づいて、治療選択を個別化するための重要な指針を提供する。例えば、出血リスクや血栓リスクが高い患者、あるいは末梢神経障害の既往がある患者では、それぞれの毒性プロファイルを考慮して適切なレジメンを選択することが可能となる。この知見は、臨床現場における個別化医療の推進に貢献すると考えられる。

先行研究との違いと本研究の新規性: 本研究は、進行非扁平上皮NSCLCの一次治療において、Pem+Cb維持療法とPac+Cb+Bev維持療法を直接比較した初の無作為化第III相試験である。これまで、これらのレジメンの有効性・安全性を直接比較したデータは不足しており、本研究で初めて両レジメンが同等の有効性を示しつつ、異なる毒性プロファイルを持つことが明確に示された。特に、G4PFSという複合エンドポイントを主要評価項目として前向きに評価した点も新規性がある。これは、有効性だけでなく、治療関連毒性による患者負担も考慮した治療選択の重要性を強調するものであった。

PointBreak試験との関連と位置付け: 同時期に実施されたPointBreak試験 (Patel et al. JClinOncol 2013) では、カルボプラチン + ペメトレキセド + ベバシズマブ導入後のペメトレキセド + ベバシズマブ維持療法が、Pac+Cb+Bev導入後のベバシズマブ維持療法と比較してPFSで優位性を示したが (HR 0.83, p=0.012)、OSには有意差がなかった。PRONOUNCE試験とPointBreak試験の結果を総合すると、「ペメトレキセド維持療法あり vs なし」ではPFSの利益があるものの、「パクリタキセル系 vs ペメトレキセド系 (ベバシズマブの有無にかかわらず)」という比較ではOSに有意差はないという臨床的整理が可能となる。

臨床応用と残された課題: 本知見は、免疫チェックポイント阻害剤が標準治療となる以前の時代において、進行非扁平上皮NSCLC患者に対する化学療法選択の個別化に重要な臨床的含意を持つ。特に、免疫療法が禁忌である患者や、純粋な化学療法を選択する患者において、各レジメンの毒性プロファイルを考慮した治療選択の指針を提供する。例えば、血液毒性リスクが高い患者にはPac+Cb+Bevが、末梢神経障害や脱毛を懸念する患者にはPem+Cbが適切であるといった判断が可能となる。

残された課題としては、本試験が2009年から2013年にかけて登録された患者を対象としており、EGFR変異やALK融合遺伝子などのドライバー変異ステータスが十分に評価されていない点が挙げられる。現代では、これらのゲノム情報やPD-L1発現状況に基づいて治療選択が細分化されており、本試験の純粋化学療法比較結果の外挿可能性は限定的である。また、ベバシズマブ含有レジメンと非含有レジメンのどちらが、免疫療法との併用療法においてより優れたバックボーンとなるか (例: IMpower150試験のATEZO (アテゾリズマブ) + BEV (ベバシズマブ) + CBDCA (カルボプラチン) + PAC (パクリタキセル) レジメンが示す抗血管新生作用と免疫療法の相乗効果) という問いは、本試験では解決されていない。今後の研究では、これらの分子生物学的特性を考慮した治療戦略の比較が求められる。

方法

試験デザインと患者選択: 本試験は、米国限定の多施設共同、無作為化、オープンラベル第III相試験 (PRONOUNCE、ClinicalTrials.gov Identifier: NCT00948675) として実施された。2009年9月から2013年1月にかけて患者がスクリーニングされ、合計496例がスクリーニング対象となり、そのうち361例が1:1の割合で無作為に割り付けられた (Arm A: n=182、Arm B: n=179)。適格基準は、18歳以上の組織学的または細胞学的に確認されたStage IV (AJCC v7.0) の非扁平上皮NSCLC患者、ECOG Performance Status (PS) 0または1、RECIST基準で測定可能な病変を有することであった。安定した治療済みの脳転移は許容された。重要な適格基準として、患者はペメトレキセドとベバシズマブの両方に対して適格である必要があった。ベバシズマブの除外基準には、扁平上皮癌、喀血、主要血管に近接する腫瘍、未コントロールの高血圧などが含まれた。

治療レジメン: Arm Aの患者は、ペメトレキセド (Pem) 500 mg/m² とカルボプラチン (Cb) AUC=6 (最大900 mg) を3週間ごとに4サイクル投与され、その後は疾患進行または忍容不可となるまでペメトレキセド維持療法を受けた。Arm Bの患者は、パクリタキセル (Pac) 200 mg/m²、カルボプラチン AUC=6、およびベバシズマブ (Bev) 15 mg/kg を3週間ごとに4サイクル投与され、その後は疾患進行または忍容不可となるまでベバシズマブ維持療法を受けた。両群ともに、ペメトレキセド投与には葉酸とビタミンB12の補充、およびデキサメタゾンの前投薬が標準的に行われた。Arm Bでは、パクリタキセルによるアレルギー反応予防のための追加の前投薬も実施された。治療は疾患進行または忍容できない毒性が発現するまで継続された。用量減量は最大2回まで許容された。

層別化因子とエンドポイント: 無作為化は、病期 (M1a vs M1b)、ECOG PS、および性別で層別化された。主要評価項目はG4PFS (グレード4毒性なしの無増悪生存期間) であり、無作為化日から最初の「グレード4有害事象、疾患進行、またはあらゆる原因による死亡」のいずれか早い方までの期間と定義された。本試験は、HR 0.75を仮定し、検出力80%、両側型I誤差10%で、360例の無作為化患者が必要と算出された。副次評価項目には、PFS (gated secondary end point)、OS、ORR、DCR (完全奏効 + 部分奏効 + 安定病変)、および安全性プロファイルが含まれた。医療資源利用状況に関するデータも収集された。

統計解析: 有効性データはITT (intent-to-treat) 集団で解析され、安全性データは少なくとも1回の治験薬投与を受けた患者 (treated集団) で評価された。G4PFS、PFS、OSなどの時間依存性エンドポイントについては、カプラン・マイヤー (Kaplan-Meier) 法による推定と、非層別ログランク (log-rank) 検定が用いられた。治療効果のハザード比は、非層別コックス回帰 (Cox regression) モデルを用いて推定された。ORRおよびDCRの群間比較には、フィッシャーの正確検定 (Fisher’s exact test) が用いられた。安全性解析には、CTCAE v3に基づき、検査値異常および非検査値異常の最大グレード有害事象、重篤な有害事象、治療中に発現した有害事象、入院、輸血、併用薬の使用状況が含まれた。毒性発現率および医療資源利用状況の比較もフィッシャーの正確検定を用いて実施された。データカットオフは2013年1月31日であった。