- 著者: Strauss GM, Herndon JE 2nd, Maddaus MA, Johnstone DW, Johnson EA, Harpole DH, Gillenwater HH, Watson DM, Sugarbaker DJ, Schilsky RL, Vokes EE, Green MR
- Corresponding author: Gary M. Strauss, MD, MPH (Tufts Medical Center, Boston, MA, USA)
- 雑誌: Journal of Clinical Oncology
- 発行年: 2008
- Epub日: N/A
- Article種別: Original Article
- PMID: 18809614
背景
完全切除された非小細胞肺癌 (NSCLC) に対する術後補助化学療法の有効性は、2003年以降に複数のランダム化臨床試験 (RCT) によって急速に確立された。国際肺癌補助療法試験 (IALT) (Arriagada et al. NEnglJMed 2004、n=1867、Stage I-III)、JBR.10試験 (Winton et al. NEnglJMed 2005、Stage IB-II)、およびANITA試験 (Douillard et al. LancetOncol 2006、Stage IB-IIIA) は、いずれもシスプラチンベースの補助化学療法が全生存期間 (OS) を改善することを示した。しかし、これらの試験におけるStage IB単独のサブセット解析では、各試験とも統計的に有意な生存利益は示されなかった (IALT: HR 0.95、95% CI 0.74-1.23; JBR.10: p=.79; ANITA: HR 1.10、95% CI 0.76-1.67)。さらに、5つのRCTを統合解析したLACE (Lung Adjuvant Cisplatin Evaluation) 解析 (Pignon et al. 2006) でも、Stage IB全体のハザード比 (HR) は0.93 (95% CI 0.78-1.10、p=.40) と統計的有意差に達しなかった。これらの結果は、Stage IB NSCLC全体に対する補助化学療法の有効性について、依然としてエビデンスが不足していることを示唆していた。
CALGB 9633は、1996年に設計されたStage IB NSCLC患者を対象とした唯一のRCTである。2004年の中間解析 (追跡中央値34ヶ月、必要死亡例155例中88例) では、OSのHRが0.62 (90% CI 0.44-0.89、一側p=.014) と有意な改善を示し、独立データ安全監視委員会 (DSMB: Data and Safety Monitoring Board) が有効性の早期終了境界を超えたと判断し、患者登録が中止された。しかし、その後の長期観察期間において、HRは減衰し (早期終了試験でしばしば見られる効果の過大評価バイアスの典型例)、最終解析での結果確認が求められた。本報告は、2007年4月時点のデータカットオフに基づく最終解析結果 (追跡中央値74ヶ月、必要死亡例155例のほぼ全例が観察されている状態) を提示するものである。
本試験でシスプラチンではなくカルボプラチンが採用された理由は、全身状態不良の患者や高齢者への忍容性への配慮に加え、当時の北米における標準的な外来治療レジメンに即した設計であったためである。日本を除く欧米の主要な補助化学療法試験がシスプラチンベースのレジメンを選択していたのに対し、本試験がカルボプラチンとパクリタキセルを選択した点で独自性がある。Stage IB NSCLCにおける補助化学療法の役割は未解明な部分が多く、特に腫瘍径による層別化の必要性が指摘されており、このギャップを埋めることが本研究の重要な課題であった。これまでの研究では、Stage IB NSCLC全体に対する補助化学療法の有効性に関するエビデンスが不足しており、特に高リスクサブグループの同定が手薄であった。
目的
本研究の主要目的は、完全切除されたStage IB NSCLC (T2N0、ロベクトミーまたは肺全摘術後) 患者を対象に、術後補助化学療法としてパクリタキセル (200 mg/m²) とカルボプラチン (AUC 6) を4サイクル投与するレジメンが、観察と比較して全生存期間 (OS) を改善するかどうかを検証することである。本試験は、Stage IB NSCLCに特化した唯一のRCTであり、この疾患ステージにおける補助化学療法の役割に関する知識ギャップを埋めることを目指した。
副次目的として、無病生存期間 (DFS) および治療関連毒性を評価すること、ならびに腫瘍径4cmを閾値とした探索的サブグループ解析を実施し、腫瘍サイズが治療効果に与える影響を検討することである。特に、Stage IB NSCLCにおける補助化学療法の有効性が確立されていない中で、特定の高リスクサブグループを同定し、その患者群における治療の潜在的な利益を評価することが重要な目的であった。本研究は、TNM分類第7版においてT2a (≤4cm) とT2b (>4cm) が分離される前の段階で、腫瘍径が予後因子として重要であるという仮説を検証するものであった。
結果
全生存期間 (OS) - 主要エンドポイント: 統計的有意差に達せず 最終解析において、化学療法群のOS中央値は95ヶ月、観察群は78ヶ月であったが、両群間の差は統計的に有意ではなかった (HR 0.83、90% CI 0.64-1.08、p=.125) (Figure 2A, Table 3)。これは、事前に設定された有意水準 (一側p<.05) を満たさなかったことを意味する。死亡数は化学療法群でn=74例 (42.7%)、観察群でn=81例 (47.4%) であった。年次OS率は、1年で化学療法群94% vs 観察群94%、2年で90% vs 84%、3年で80% vs 73%、5年で60% vs 58%、6年で55% vs 53%であった。2004年の中間解析で報告されたHR 0.62から最終解析のHR 0.83への著明な減衰は、早期終了試験における効果の過大評価バイアスの典型的な実例として、統計学的に重要な教訓を提供した。観察されたHR 0.83 (17%の死亡リスク低下) は、本試験のサンプルサイズ (n=344) では検出力が31%しかなく、統計的有意差を検出するには不十分であったと考えられる。性別 (p=.29) および民族性 (p=.28) によるOSの差は認められなかった。
無病生存期間 (DFS) - 副次エンドポイント: 有意差なし DFSにおいても、化学療法群のDFS中央値は89ヶ月、観察群は56ヶ月であったが、統計的有意差には達しなかった (HR 0.80、90% CI 0.62-1.02、p=.065) (Figure 2B, Table 3)。OSと同様に、効果の方向性は化学療法群に有利であったものの、有意水準には達しなかった。年次DFS率は、1年で化学療法群85% vs 観察群81%、2年で75% vs 68%、3年で67% vs 58%、5年で52% vs 48%、6年で51% vs 46%であった。性別 (p=.64) および白人・非白人民族間 (p=.17) での治療効果の差は認められなかった。
競合リスク解析: 肺癌による死亡リスクの低下を示唆 競合リスクモデルを用いて肺癌による死亡とその他の原因による死亡の確率を推定した結果、肺癌による死亡は化学療法群でn=39例 (22.5%)、観察群でn=50例 (29.2%) であり、化学療法群で28%の肺癌死亡リスク低下が示唆された (HR 0.72、90% CI 0.50-1.02、p=.059) (Table 4)。しかし、この差は統計的有意差には達しなかった (肺癌による死亡がn=89例では検出力不足であったと考えられる)。その他の原因による死亡は両群間で差がなかった (HR 1.02、90% CI 0.68-1.53、p=.47)。
腫瘍径4cm以上 (n=196) サブグループにおけるOSおよびDFS: 有意な改善 腫瘍径が4cm以上の患者196例 (全体の59%) のサブグループ解析では、化学療法群 (n=99) と観察群 (n=97) の間で、OSおよびDFSともに統計的に有意な改善が認められた。このサブグループにおける平均腫瘍径は、化学療法群で5.77 cm、観察群で5.80 cm (中央値5.0 cm) であった。OSは、化学療法群でHR 0.69 (90% CI 0.48-0.99、p=.043) と有意に改善し、死亡リスクが31%減少した (Figure 2C, Table 3)。OS中央値は化学療法群99ヶ月 vs 観察群77ヶ月であった。死亡数は化学療法群でn=37例 (38%)、観察群でn=53例 (55%) であった。2年OS率は化学療法群90% vs 観察群81% (p=.047) であった。DFSも同様に、化学療法群でHR 0.69 (90% CI 0.49-0.97、p=.035) と有意に改善し、再発または死亡リスクが31%減少した (Table 3)。DFS中央値は化学療法群96ヶ月 vs 観察群63ヶ月であった。この結果は、大型腫瘍を有するStage IB患者に対する補助化学療法の有益性を強く支持するものであり、第7版TNM分類においてT2a (≤4cm) とT2b (>4cm) が分離される主要な根拠の一つとなった。この知見は、JBR.10試験の更新解析 (Butts et al. 2010) でも独自に確認されており、腫瘍径4cm以上の患者でHR 0.66のOS改善が報告されている。
腫瘍径4cm未満 (n=134) サブグループにおけるOSおよびDFS: 有益性なし、むしろ有害傾向 腫瘍径が4cm未満の患者134例 (全体の41%) のサブグループ解析では、化学療法群 (n=63) と観察群 (n=71) の間で、補助化学療法の有益性は認められなかった。このサブグループにおける平均腫瘍径は、化学療法群で2.73 cm、観察群で2.71 cm (中央値3.0 cm) であった。OSは、化学療法群でHR 1.12 (90% CI 0.75-1.67、p=.32) と、数値上は観察群の方が良好な傾向を示した (Figure 2D, Table 3) (OS中央値:化学療法群61ヶ月 vs 観察群78ヶ月)。DFSもHR 1.01 (90% CI 0.69-1.48、p=.49) と差はなかった。この結果は統計的有意差がなく探索的解析の産物であることに留意が必要だが、Stage IBの中でも腫瘍サイズによる異質性が存在し、小型腫瘍患者には補助化学療法が有益でない可能性を示唆する重要な発見であった。
毒性プロファイル: 治療関連死ゼロ、許容可能な忍容性 化学療法群のn=158例 (91%) で毒性データが評価された。治療関連死はn=0例であった (Table 2)。最も頻度の高かったGrade 3/4の毒性は好中球減少で、n=54例 (35%) に認められた (Grade 3: 11%、Grade 4: 24%)。その他のGrade 3/4毒性としては、血小板減少が6%、高血糖が16% (Grade 3: 15%、Grade 4: 1%)、悪心嘔吐が6%、感覚性神経障害が5%であった。化学療法完遂率 (4サイクル全て投与) はn=117例 (86%) であり、4サイクル全量投与を完遂したのはn=77例 (57%) であった。パクリタキセルとカルボプラチンの併用療法は比較的良好な忍容性を示し、シスプラチンベースの試験と比較してアドヒアランスが良好であったことが示唆された。
考察/結論
CALGB 9633の最終解析は、完全切除Stage IB NSCLC全体に対する術後補助化学療法 (パクリタキセル+カルボプラチン) の統計的に有意なOS改善を示すには至らなかった (HR 0.83、90% CI 0.64-1.08、p=.125)。この結果は、LACE統合解析 (HR 0.93、p=.40) や、Winton et al. NEnglJMed 2005、Douillard et al. LancetOncol 2006、IALTのStage IB部分集団解析がいずれも有意な利益を示さなかった結果と一致する。したがって、現時点ではStage IB NSCLC全体への補助化学療法の常規適応にはエビデンスが不十分であると結論される。
本試験の限界として、第一に、n=344例という比較的小規模なサンプルサイズでは、実際のHR 0.83という効果量を検出する検出力が31%しかなく、統計的有意差を証明するには不十分であった点が挙げられる。第二に、2004年の早期終了による効果の過大評価バイアス (HR 0.62から0.83への減衰) が生じたことである。第三に、主要エンドポイントに関して片側検定の採用とP<.05の有意水準というやや緩い統計学的設定が批判を受けた。
先行研究との違い: 本研究は、これまでのStage IB NSCLC全体を対象とした補助化学療法の有効性に関する報告と異なり、腫瘍径4cm以上 (>4.0 cm) のサブグループ (n=196、全体の59%) において、OS HR 0.69 (90% CI 0.48-0.99、p=.043) およびDFS HR 0.69 (90% CI 0.49-0.97、p=.035) と、統計的に有意な改善が認められたことを明確に示した。これは31%の死亡リスク低下という実質的な効果を示しており、本研究で初めてStage IBの中でも高リスク患者群に対する補助化学療法の有効性を明確に示した。この知見は、Winton et al. NEnglJMed 2005試験のデータでも独自に確認されており (腫瘍径4cm以上でHR 0.66)、その後のLACE拡張解析でも検討された。
新規性: 本研究で初めて、Stage IB NSCLCという一括りの病期分類の中にも、腫瘍径という明確な予後因子によって治療効果が異なる患者群が存在することを明らかにした点で新規性がある。この結果は、現行の第8版TNM分類でT2a (≤4cm) とT2b (>4cm) を分離する科学的根拠の一つとして機能した。
臨床応用: 本知見は、Stage IB NSCLC患者の治療戦略に臨床応用される可能性を持つ。特に、腫瘍径4cm以上の患者に対しては、術後補助化学療法を検討する根拠となり、臨床現場での意思決定に影響を与える。パクリタキセルとカルボプラチンの併用療法は忍容性が良好であり、治療関連死もゼロであったことから、選択されたStage IB患者における治療選択肢の一つとなり得る。現行ガイドラインでは、Stage IBの中でも腫瘍径4cm以上 (T2bN0に相当) の患者には補助化学療法を「考慮する」根拠として本試験が引用される。逆に、腫瘍径4cm未満の患者ではHR 1.12と有害方向を示しており、このサブグループへの補助化学療法は現在のガイドラインでも推奨されない。
残された課題: 今後の検討課題として、本試験は分子スクリーニングなしの歴史的コホートを対象としており、EGFR変異を持つ患者へのEGFR-TKI補助療法 (ADAURA試験でオシメルチニブがDFS改善) の時代において、現代の個別化医療の枠組みでの再解釈が重要である。分子マーカーによる高リスクStage IB患者の同定は今後の課題として残る。また、腫瘍径4cm未満の患者で観察された有害傾向 (HR 1.12) は統計的有意差がない探索的解析の結果であり、さらなる検証が必要であるというlimitationがある。
方法
本研究は、Cancer and Leukemia Group B (CALGB)、Radiation Therapy Oncology Group (RTOG)、およびNorth Central Cancer Treatment Group (NCCTG) の3つの研究グループが共同で実施した多施設ランダム化第3相試験 (CALGB 9633) である。患者登録は1996年9月から2003年11月まで行われた。対象患者は、病理学的に確認されたStage IB (T2N0M0) のNSCLCで、ロベクトミーまたは肺全摘術による完全切除が施行され、ECOGパフォーマンスステータスが0または1、年齢が18歳以上であった。合計344例の患者が登録され、化学療法群にn=173例、観察群にn=171例がランダムに割り付けられた。患者背景は、男性64%、年齢中央値61-62歳、腺癌51%、扁平上皮癌34%であり、両群間でバランスが取れていた (Table 1)。腫瘍径中央値は4.0 cm (平均4.59 cm/4.50 cm) であり、腫瘍径が4.0 cm以上の患者が全体の59% (196/330例) を占めた。術前縦隔鏡検査は80%の患者で施行され、切除術式はロベクトミーが89%、肺全摘術が11%であった。
化学療法レジメンは、パクリタキセル200 mg/m² (3時間かけて静脈内投与) とカルボプラチンAUC 6 mg/mL/min (45-60分かけて静脈内投与) を3週間ごとに4サイクル投与するもので、切除後4-8週以内に開始された。主要エンドポイントは全生存期間 (OS) であり、OSはランダム化からあらゆる原因による死亡までの期間と定義された。当初は500例の登録を目標としていたが、登録の遅延により2000年に目標症例数を384例に減らし、統計的検出力を維持するために片側検定 (一側α=.05) を採用した。80%の検出力で5年OS率が50%から63%へ13%絶対改善 (HR 0.67に相当) を検出するように設計された。副次エンドポイントは無病生存期間 (DFS) および毒性であった。DFSはランダム化から再発または死亡までの期間と定義された。腫瘍径 (4cm以上 vs 4cm未満) 別の事前規定探索的解析も実施された。
統計解析には、Kaplan-Meier法による生存曲線、ログランク検定 (log-rank test)、およびCox比例ハザードモデル (Cox proportional hazards model) が用いられた。サブグループ解析は、Coxモデルを用いて腫瘍径、性別、民族性による治療効果の差を検討した。報告されるP値は、特に明記しない限り片側検定の結果であり、信頼区間は片側P値に対応する両側90%信頼区間である。データ解析は2007年4月6日時点のCALGBデータベースに基づいて行われた。中間解析は独立データ安全監視委員会 (DSMB) によって半年に一度実施され、2003年11月にはOSのP値が事前に規定された早期終了境界値 (Lan-DeMets α spending function with O’Brien-Fleming boundaries) を下回ったため、患者登録が中止された。