• 著者: Taofeek K. Owonikoko, Madhusmita Behera, Zhengjia Chen, Chandar Bhimani, Walter J. Curran, Fadlo R. Khuri, Suresh S. Ramalingam
  • Corresponding author: Taofeek K. Owonikoko (Winship Cancer Institute, Emory University, Atlanta, GA, USA)
  • 雑誌: Journal of Thoracic Oncology
  • 発行年: 2012
  • Epub日: N/A
  • Article種別: Original Article (Systematic Analysis / Meta-analysis)
  • PMID: 22722788

背景

小細胞肺癌 (SCLC) は全肺癌の約13-15%を占め、診断時の約2/3が進展型 (ED-SCLC) である。一次治療ではplatinum+etoposide (PE) レジメンが標準治療であり、初回奏効率 (ORR) は60-80%と高いものの、大半の患者が6-12か月以内に再発し、ED-SCLCの5年生存率は1-2%に留まる極めて予後不良な疾患である。再発SCLCに対する二次治療の有効性は、一次治療からの無治療期間 (TFI: treatment-free interval) によって異なることが臨床観察で知られていた。具体的には、一次治療終了から再発までの期間が90日以上の場合を「感受性再発 (sensitive relapse) 」、治療中進行または90日以内再発の場合を「難治性/耐性再発 (refractory/resistant relapse) 」と分類し、両者で二次治療の奏効率に明確な差があるとされてきた。米国FDAは二次治療薬としてtopotecanのみを承認しているが、その承認の根拠となった試験においても、感受性群と難治性群における有効性の定量的比較は系統的になされていなかった。

新規二次治療薬の開発や臨床試験設計を進める上で、感受性と難治性の分類が奏効率や生存期間のベンチマークとしてどの程度の差を示すのか、その基準値が不足していた。また、topotecan以外のamrubicin、irinotecan、paclitaxelなどの単剤または併用療法が二次治療においてどのような位置付けとなるのかも、感受性・難治性別の有効性データを統合解析することで明確化する必要があった。先行研究では、個別の臨床試験で感受性・難治性SCLCにおける二次治療効果が報告されてきたが、それらの結果は小規模であり、試験デザインや対象患者の異質性から、一貫した結論を導き出すことが困難であった。例えば、vonPawel et al. JClinOncol 1999OBrien et al. JClinOncol 2006のtopotecanに関する主要な試験でも、感受性・難治性群間の直接的な比較や統合解析は限定的であった。また、Schiller et al. JClinOncol 2001の研究もtopotecanの有効性を示したが、感受性・難治性分類における詳細な比較は不足していた。

本研究は、これら先行する小規模試験の結果を統合し、感受性SCLCと難治性SCLCにおける二次治療効果の差を定量化する初の包括的な系統的解析として計画された。これにより、再発SCLCの二次治療における感受性分類の臨床的妥当性を確立し、将来の臨床試験設計や治療戦略立案のための強固なエビデンスを提供することが期待された。特に、一次治療からの無治療期間という簡便な臨床指標が、二次治療の有効性を予測する上でどの程度の予測能を持つのかを大規模データで検証することは、臨床現場における意思決定に大きく貢献すると考えられた。これまでの研究では、この重要な臨床的ギャップが未解明なままであった。

目的

本研究の目的は、再発小細胞肺癌 (SCLC) に対する二次化学療法の有効性を、一次治療奏効後の無治療期間に基づく「感受性 (sensitive) 」と「難治性/耐性 (refractory/resistant) 」サブグループ別に系統的に比較し、奏効率 (ORR) および全生存期間 (OS) における差を定量化することである。具体的には、感受性SCLC患者と難治性SCLC患者の間で、二次治療に対する奏効のオッズ比 (OR) を算出し、その統計的有意性を評価する。また、両サブグループにおける加重平均中央OSを比較し、その差の臨床的意義を検討する。さらに、本解析の頑健性を評価するため、試験間の異質性を評価し、複数の感度分析を実施することで、結果の安定性を検証する。最終的に、これらの統合解析結果に基づき、再発SCLCの二次治療における感受性分類の臨床的妥当性を確立し、新規治療薬開発のためのベンチマークを提示することを目指す。

結果

試験抽出と患者特性: 初期検索で4,124報の文献が特定され、タイトルおよび抄録スクリーニングを経て86報が詳細評価の対象となった。最終的に、本系統的解析の適格基準を満たした21試験 (1984年から2011年の間に発表) が選定された (Figure 1)。これらの試験に登録された患者の総数は1,692例であり、内訳は感受性SCLC患者が912例、難治性SCLC患者が780例であった。奏効データは20試験の1,055例 (感受性570例、難治性485例) で利用可能であった。生存データは11試験の1,219例 (感受性678例、難治性541例) で利用可能であった。対象となった治療薬剤は多岐にわたり、topotecan、amrubicin、irinotecan、paclitaxel、docetaxel、gemcitabine、vinorelbineなどの単剤療法、およびCAV (cyclophosphamide, doxorubicin, vincristine) やtopotecan+platinumなどの併用療法が含まれた。特に、topotecanを評価した試験は6件、amrubicinを評価した試験は3件、併用療法を評価した試験は7件であった (Table 1)。

全体奏効率と感受性・難治性比較: 全21試験を統合した二次治療の全体奏効率 (ORR) は17.9%であった。感受性SCLC患者の奏効率は27.7% (範囲0-77%) であったのに対し、難治性/耐性SCLC患者の奏効率は14.8% (範囲0-70%) であった。感受性群の奏効率は難治性群と比較して統計学的に有意に高かった (p=0.0001)。感受性SCLC患者と難治性SCLC患者間の統合奏効オッズ比 (OR) は2.235 (95% CI 1.518-3.291, p=0.001) であり、感受性群で約2.2倍の奏効確率が示された (Figure 2)。この結果は、一次治療からの無治療期間による分類が、二次治療の有効性を予測する強力な因子であることを明確に裏付けるものであった。

生存期間比較: 報告のあった11試験1,219例の生存データを用いて、加重平均中央全生存期間 (OS) を比較した。感受性SCLC患者群の加重平均中央OSは7.73か月 (範囲2.7-8.7か月) であったのに対し、難治性/耐性SCLC患者群では5.45か月 (範囲4.4-9.9か月) であった。感受性群のOSは難治性群と比較して統計学的に有意に延長していた (p=0.0035)。この差は絶対値で約2.3か月であるが、再発SCLCの極めて不良な予後を考慮すると、臨床的に意義のある差であると判断された。難治性群においても5.45か月の中央OSが得られており、二次治療が難治性SCLC患者にも一定の臨床的ベネフィットをもたらすことが示唆された。

異質性と感度分析: 試験間の異質性は、Cochran’s χ²検定でp=0.347、I²インデックス9.029%と非常に低い値を示し、統合結果の頑健性が確認された。これは、各試験の結果が一貫しており、統合解析の信頼性が高いことを意味する。感度分析として、固定効果モデルを用いた再解析では、OR 2.227 (95% CI 1.550-3.198) と同様の結果が得られ、モデル選択による結果の変動がないことが示された (Figure 3)。また、leave-one-out解析では、個々の試験を1つずつ除外しても、ORは1.926-2.480の範囲で安定しており、特定の試験が全体結果に過度に影響を与えていないことが確認された (Table 2)。さらに、topotecan試験6件を除外した解析でもOR 2.045 (95% CI 1.361-3.073, p<0.001) と結果は維持された (Figure 5)。併用療法試験を除外した解析でもOR 2.090 (p<0.001) であり (Figure 6)、単剤療法試験を除外した解析でもOR 2.405 (p=0.002) と、いずれの感度分析においても主要な結論は維持された (Figure 7)。出版バイアスについては、funnel plotで非対称性は認められず、Egger検定でも統計学的に有意な偏りは検出されなかった。

臨床的含意のサブグループ: 感受性群における最高奏効率は77% (併用療法試験) であり、難治性群における最高奏効率は70% (新規細胞障害性薬剤試験) であった。これは、両群ともに新規薬剤や併用療法によって高い奏効率を達成する余地があることを示唆している。しかし、多くの試験では感受性群の奏効率は20-40%の範囲に、難治性群の奏効率は10-20%の範囲に収束していた。このことから、感受性SCLCのベンチマークとしてORR 25-30%および中央OS 7-8か月、難治性SCLCのベンチマークとしてORR 10-15%および中央OS 5-6か月が、新規二次治療薬開発における参照値として確立された。

考察/結論

本系統的解析は、21試験1,692例という当時最大規模の再発SCLC二次治療データを統合し、感受性SCLCが難治性SCLCに比して奏効率 (OR 2.235, 27.7% vs 14.8%, p=0.0001) と全生存期間 (7.73 vs 5.45か月, p=0.0035) で有意に良好な治療成績を示すことを定量化した初の研究である。

新規性: 本研究で初めて、一次治療からの無治療期間に基づく感受性分類が、二次治療の有効性を予測する上で強力かつ一貫した予測因子であることを大規模データで確立した。低異質性 (I²=9.029%) と多様な感度分析 (leave-one-out、topotecan/併用/単剤除外) での結果安定性は、本知見の頑健性を強く支持する。

先行研究との違い: これまでのvonPawel et al. JClinOncol 1999やEckardt et al.の個別試験では、感受性・難治性群間の層別解析が限定的であったり、小規模なコホートでの報告に留まっていた。本統合解析は、これらの先行研究とは異なり、より広範なデータセットを用いて感受性分類の臨床的意義を統計学的に明確に確立した点で画期的である。

臨床応用: 本研究の知見は、再発SCLCの臨床現場における意思決定に複数の臨床的含意を提供する。(1) 再発SCLC患者の二次治療選択において、一次治療無治療期間 (90日閾値) による感受性・難治性分類は引き続き重要な予後予測因子として機能する。(2) 難治性群でも中央OS 5.45か月、ORR 14.8%と一定の治療ベネフィットが得られるため、無治療選択ではなく二次治療を積極的に検討すべきである。(3) 新規二次治療薬の臨床試験では、感受性・難治性群を層別化した効果評価が必須であり、両群で異なる有効性ベンチマークを設定する必要がある。(4) 将来の臨床試験での薬剤承認判断に際し、感受性群ORR 25-30%、難治性群ORR 10-15%を対照群 (または現行治療) のベンチマークとして使用可能である。

残された課題: 本研究にはいくつかの限界も存在する。(1) 試験間の感受性・難治性定義に微細な相違 (90日 vs 60日閾値など) があった可能性がある。(2) 個別患者データ (IPD) を使用しておらず、集計データに基づく解析である。(3) 一次治療レジメンの不均一性 (PE vs IPなど) や、再治療時のPS (performance status) や肝転移の有無といった患者特性の未調整が、結果に影響を与えた可能性も否定できない。(4) 1984年から2011年という長い期間の治療成績を統合しているため、時代効果の混入も考慮する必要がある。今後の検討課題として、lurbinectedin (2020年FDA承認) や免疫チェックポイント阻害薬 (nivolumab、pembrolizumabなど) が二次治療選択肢に加わった現在の臨床状況において、これらの新規薬剤に対する感受性分類の妥当性を検証することが挙げられる。また、分子マーカー (SLFN11、DLL3、ASCL1/NEUROD1サブタイプなど) との統合による精密層別化や、感受性群における併用療法の最適化も今後の研究方向性として重要である。本系統的解析は、再発SCLCの臨床試験設計の基盤を確立した歴史的に重要な研究であり、その知見は現在もなお参照され続けている。

方法

本系統的解析では、MEDLINE、EMBASE、Cochrane Libraryの電子データベースに加え、米国臨床腫瘍学会 (ASCO) および国際肺癌学会 (IASLC) の学会抄録を対象に、1984年から2011年までの期間に発表された文献を包括的に検索した。検索キーワードには、「SCLC」、「second-line chemotherapy」、「sensitive」、「refractory」、「relapsed」を用いた。

適格基準は以下の通りである。(1) 組織学的または細胞学的にSCLCと確診された患者を対象としていること。(2) 一次化学療法後に再発した患者を対象とした試験であること。(3) 感受性群 (一次治療終了後90日以上経過後に再発) と難治性/耐性群 (治療中進行または90日以内再発) の両方または片方を含む前向き臨床試験であること。(4) 各試験の患者数が10例以上であること。(5) 英語で発表された論文であること。動物実験や症例報告、総説は除外した。本研究は、既存の公開データを統合する系統的レビューであり、個別の臨床試験 (RCT) ではないため、特定のNCT (National Clinical Trial) 識別子はない。

文献抽出とデータ抽出は、2名の独立した査読者 (T.K.O.とM.B.) が実施した。意見の不一致が生じた場合は、第3の査読者 (S.S.R.) が介入し、合意形成を図った。抽出されたデータには、患者背景、登録患者数、感受性群と難治性群の内訳、使用された特定の治療レジメン、奏効率 (ORR)、および全生存期間 (OS) の臨床アウトカムが含まれた。

統計解析には、Comprehensive Meta Analysis v2.2.048ソフトウェアを用いた。奏効率の比較には、ランダム効果モデルを用いて、感受性群と難治性群間の奏効オッズ比 (OR) と95%信頼区間 (CI) を算出した。全生存期間 (OS) については、各試験で報告された中央OS値を症例数で重み付けした加重平均値を算出し、両群間の比較には両側Studentのt検定を用いた。

試験間の異質性 (heterogeneity) の評価は、Cochran’s χ²検定 (p<0.10で統計的有意と判断) とI²インデックス (>25%で中等度の異質性、>50%で高度の異質性と判断) を用いて実施した。

感度分析 (sensitivity analysis) として、以下の5つの解析を実施し、結果の頑健性を評価した。(1) leave-one-out解析:個々の試験を1つずつ除外して解析を繰り返し、特定試験が全体結果に与える影響を評価した。(2) 併用療法試験のみを除外した解析。(3) 単剤療法試験のみを除外した解析。(4) topotecanを評価した試験を除外した解析。(5) ランダム効果モデルと固定効果モデル (fixed-effect model) の結果を比較した。出版バイアス (publication bias) は、funnel plotの視覚的評価とEgger検定を用いて評価した。