- 著者: Ohe Y, Ohashi Y, Kubota K, Tamura T, Nakagawa K, Negoro S, et al.
- Corresponding author: Ohe Y (National Cancer Center Hospital, Tokyo)
- 雑誌: Annals of Oncology
- 発行年: 2007
- Epub日: N/A
- Article種別: Original Article (Phase III randomized clinical trial)
- PMID: 17079694
背景
2000年代初頭、進行NSCLC (non-small cell lung cancer, 非小細胞肺癌) に対する標準的なプラチナ併用化学療法は世界的に確立されていなかった。米国ECOG (Eastern Cooperative Oncology Group) E1594試験では4種類のレジメン (CDDP+PTX, CDDP+GEM, CDDP+DOC, CBDCA+PTX) が比較されmOS (median overall survival) 7.4-8.1ヶ月で有意差なく、いずれも標準的選択肢と結論された (Schiller 2002 NEJM、PMID 11784875)。同様に欧州Scagliotti 2002 (CDDP+GEM vs CBDCA+PTX vs CDDP+VNR) ・米国TAX 326 (Fossella 2003、CDDP+DOC vs CBDCA+DOC vs CDDP+VNR) でもプラチナdoublet間の優劣は明確でなかった。一方日本では先行する2つの第III相試験で、まずVDS (vindesine, ビンデシン) を含む CDDP+VDS vs CDDP+VDS+MMC (mitomycin C, マイトマイシンC) 比較、続いてCDDP+CPT-11 (irinotecan, イリノテカン) vs CDDP+VDSの比較が行われ、これらのメタ解析でCDDP+CPT-11 (IP) が独立した予後良好因子として同定され、日本における事実上の標準レジメンとなっていた (Negoro et al. JClinOncol 2002 およびFukuoka et al. JClinOncol 2000 系列の予備的データ参照)。さらに1999年に日本の厚生労働省がパクリタキセル (PTX) ・ゲムシタビン (GEM) ・ビノレルビン (VNR) をNSCLCに承認し、これらの薬剤の有効性と安全性を日本人で確認する第III相試験の実施が求められた (Schiller et al. NEnglJMed 2002 のECOG E1594と整合する試験設計が必要であった)。これまでの研究で何が足りなかったかというgapを整理すると、(a) 日本人を対象としたPTX・GEM・VNR含有プラチナdoubletの大規模phase III比較が未解明、(b) IPが他の第三世代doubletより本当に優れているかどうかが未解明、(c) 各レジメン間の毒性プロファイル比較データが不十分、の3点であった。これら未解明の問いに答えるべく、日本臨床腫瘍研究グループ (JCOG) によりFACS (Four-Arm Cooperative Study) 試験が企画された。
目的
未治療の進行NSCLC (stage IIIB/IV) 患者において、シスプラチン+イリノテカン (IP) を対照レジメンとして、カルボプラチン+パクリタキセル (TC)、シスプラチン+ゲムシタビン (GP)、シスプラチン+ビノレルビン (NP) の3レジメンの全生存期間における非劣性 (non-inferiority margin: 1年生存率の差 −10%) を検証すること。副次目的は奏効率・奏効持続期間・TTP (time to progression) ・TTTF (time to treatment failure) ・毒性・QOL (quality of life)。
結果
患者登録と背景因子:2000年10月〜2002年6月に日本全国44施設で602例が中央登録された。IP群n=151・TC群n=150・GP群n=151・NP群n=150の割付の後、n=10が化学療法未施行、n=11が不適格と判明し、毒性評価対象n=592・有効性評価対象n=581となった (各群n=145-146)。年齢中央値はIP群62歳 (30-74歳) ・TC群63歳・GP群61歳・NP群61歳。PS 0は各群n=44-45 (約30%)、男性は各群n=97-101 (約67-70%)。組織型はIP群で腺癌が121/145例 (83%) と他群 (104-109例、71-76%) より多く、扁平上皮癌はIP群n=16に対して他群n=29-31と偏りがあったことは試験の限界の一つである。病期はIIIBが各群n=26-31 (18-21%)、IVがn=114-119 (79-82%)。平均サイクル数はIP群3.0±1.3・TC群3.5±1.5・GP群3.2±1.2・NP群3.1±1.3 (mean±SD)。2004年6月時点でn=447が死亡し、全例2年以上の追跡期間が確保された (Fig 1のCONSORT diagram、Table 1の患者背景)。
奏効率と生存期間 — 4群間に統計的有意差なし:奏効率はIP群31.0% (45/145例、奏効持続期間中央値4.8ヶ月)・TC群32.4% (4.0ヶ月)・GP群30.1% (3.5ヶ月)・NP群33.1% (3.4ヶ月) で、いずれも統計的有意差は認められなかった (Fig 2、Table 2)。OS中央値はIP群13.9ヶ月 (95% CI 11.7-15.4)・TC群12.3ヶ月 (95% CI 10.4-14.1)・GP群14.0ヶ月 (95% CI 11.5-16.0)・NP群11.4ヶ月 (95% CI 10.0-13.5)。IPに対するHR (hazard ratio) はTC vs IPでHR 1.08 (95% CI 0.85-1.36)・GP vs IPでHR 0.99 (95% CI 0.78-1.25)・NP vs IPでHR 1.13 (95% CI 0.90-1.41) と全群でhazard ratioが1の95% CIを含み有意差なし (vs IP)。OS差は4群間でmaximum 2.6ヶ月 (GP 14.0 vs NP 11.4)。1年生存率はIP群59.2%・TC群51.0%・GP群59.6%・NP群48.3%。2年生存率はIP群26.5%・TC群25.5%・GP群31.5%・NP群21.4%。なお当初の1年生存率予測43%を大きく上回ったのは、PS 2除外の良好な患者選択・docetaxel/gefitinibを含む有効な二次治療・アジア人特有の薬理ゲノミクスが寄与したと考えられる。TTP中央値はIP群4.7ヶ月・TC群4.5ヶ月 (P=0.355、HR 1.10 vs IP) ・GP群4.0ヶ月 (P=0.170) ・NP群4.1ヶ月 (P=0.133) (Fig 3)。TTTF中央値はIP群3.3ヶ月・TC群3.2ヶ月 (P=0.282) ・GP群3.2ヶ月 (P=0.567) ・NP群3.0ヶ月 (P=0.091)。いずれも4群間に統計的差異なし。
非劣性の統計的証明は不成立:1年生存率の差の95% CI下限はTC群で −19.6% (95% CI −19.6% 〜 +3.3%) 、GP群で −10.9% (95% CI −10.9% 〜 +11.7%) 、NP群で −22.3% (95% CI −22.3% 〜 +0.5%) であり、いずれも設定した非劣性マージン −10% を下回ったため、3試験レジメンのIPに対する統計的非劣性は確認されなかった。ただしGP群は差の95% CI上限が +11.7% と幅広く、1年生存率差の点推定値はほぼ0 (+0.4%) であり、GP群の実質的な同等性は最も支持しやすいデータであった。この非劣性未達の主たる理由は、実際の1年生存率がIPで43%予測に対し59.2%と大幅に高かったため、検定の構造上、試験群の信頼区間が広がり非劣性マージン達成が困難になったことである。
毒性プロファイルは4レジメンで明確に異なる:IP群ではGrade 3/4の白血球減少47.6%・好中球減少83.7%・発熱性好中球減少症14.3%、Grade 2以上の嘔気60.5%・嘔吐51.0%・食欲不振65.3%・下痢48.3%と骨髄抑制と消化器毒性が顕著であった (Table 3)。GP群ではIPと比較してGrade 3/4白血球減少 (33.1%、P=0.010) と好中球減少 (62.9%、P<0.001) が有意に少なく、発熱性好中球減少症は著明に少なかった (2.0% vs 14.3%、P<0.001)。一方Grade 3/4血小板減少はGP群35.1% (vs IP群5.4%、P<0.001) と最多であった。TC群ではGrade 2以上の嘔気 (25.0%、P<0.001) ・嘔吐 (22.3%、P<0.001) ・食欲不振 (32.4%、P<0.001) ・下痢 (6.8%、P<0.001) がIPより有意に少なかった一方、感覚神経障害 (16.9%、P<0.001) ・関節痛 (21.6%、P<0.001) ・筋肉痛 (17.6%、P<0.001) ・Grade 2脱毛 (44.6%、P=0.013) が有意に多かった。NP群ではGrade 2以上の注射部位反応 (26.7% vs IP群4.8%、P<0.001) と便秘が顕著で、Grade 3/4白血球減少もIPより有意に高かった (67.1%、P<0.001)。治療関連死はIP群n=3 (2.0%:脳出血・間質性肺炎・急性循環不全/DIC) ・TC群n=1 (0.7%:急性腎不全) ・NP群n=1 (0.7%:肺塞栓症)、GP群はn=0。
二次治療とQOL:二次治療として化学療法を受けた患者はIP群74%・TC群60%・GP群69%・NP群66%で有意差なし (P=0.081) 。二次治療薬はdocetaxel (各群n=25-51) ・gemcitabine (n=17-28) ・paclitaxel (n=7-15) ・gefitinib (n=9-18) が多用された。有効な二次治療が全レジメンのOS延長に貢献した可能性がある。全体的なQOLはFACT-L日本語版・QOL-ACD双方において4群間で有意差なし。QOL-ACD身体領域スコアのみTC・GP・NP群がIP群より有意に優れており、IP群での高い下痢発生率が関連していると考えられた。
考察/結論
本FACS試験はイリノテカン含有レジメンを他のプラチナ+第三世代薬物doubletと比較した初の第III相試験であり、世界的に標準レジメンが確立されていない状況下で日本発の重要な比較データを提供した。これまでの先行研究と比較すると、本試験は対象人種・適応薬剤・統計設計が異なる初の日本人large-scale phase III試験である。これまでの主要な比較試験 (Schiller 2002 ECOG E1594: mOS 7.4-8.1ヶ月、4 arm; Scagliotti 2002: 7.6-9.8ヶ月; Fossella 2003 TAX 326: 10.3ヶ月) と相違する点として、本試験のOSは顕著に長かった (11.4-14.0ヶ月)。これは欧米とは異なる結果であり、PS 2患者の除外・有効な二次治療の充実 (gefitinibを含む)・アジア人における薬理ゲノミクス的差異 (CYP3A4多型・UGT1A1 polymorphism等のirinotecan代謝関連) が主因として挙げられる。Japan-SWOG共通解析でも同様の日本人集団でのOS優位が確認されている。novelな知見として、4種のplatinum doubletが日本人集団においてmOS 11.4-14.0ヶ月の範囲で類似有効性を示すこと、ならびに毒性プロファイルが明確に異なる (IP=消化器毒性+骨髄抑制、TC=神経障害+脱毛、GP=血小板減少、NP=注射部位反応+好中球減少) という4レジメン横断的比較データが本研究で初めて日本人で大規模に提示された。統計的には非劣性が証明されなかったが、奏効率・OS・TTP・TTTFのいずれにも有意差はなく、4レジメンの有効性は実質的に同等であった。非劣性未達の主因は、予測 (43%) を大幅に上回る実際のIPの1年生存率 (59.2%) により、統計的な検出力の要件が事実上高まったことにある。毒性プロファイルの違いは臨床的意思決定において重要であり、臨床応用および臨床的意義の観点では、患者個別の状況 (合併症・生活背景・就業状況・QOL優先事項) に応じたレジメン選択が推奨される。消化器毒性を避けたい患者にはTC/GP/NP、血液毒性の管理が重要な患者にはGP (血小板減少に注意) 、神経障害リスクが懸念される患者にはIP/GP/NPが適切な選択となりうる。本ファイルはAnnOncol-2007-Ohe-FACS trialと同一内容の長尺ファイル名版である。残された課題と今後の展望 (limitation) としては、(i) IP群での腺癌偏在 (83%) という背景因子の不均衡、(ii) 後続のEGFR-TKI時代におけるEGFR変異層別解析の不在 (2007年時点ではEGFR検査が必須でなかった)、(iii) 高齢者 (75歳以上) ・PS 2の患者を除外していること、(iv) bevacizumab/pemetrexed等のその後の重要薬剤未含有、(v) 非劣性デザインの統計設定 (1年生存率差 −10%) の妥当性の再検討、(vi) アジア人特有の薬理ゲノミクス的差異の体系的検証、が挙げられる。本試験は当時最大規模の日本人集団を対象とした多施設無作為化比較試験として、プラチナdoublet比較に関する重要なエビデンスを国際的に発信し、その後のpemetrexed Scagliotti et al. NEnglJMed 2008 やbevacizumab併用試験へのpatientコホート選択指針となった。前駆研究としてはSchiller et al. NEnglJMed 2002 のECOG E1594が4レジメン比較の方法論的基盤となり、本試験は同一の質問を日本人で再検証したものといえる。さらに維持療法・二次治療 (Shepherd et al. NEnglJMed 2000 のdocetaxel二次治療) を組み合わせた現代的treatment continuumの起点として位置づけられる。
方法
2000年10月〜2002年6月に日本全国44施設で未治療の進行NSCLC患者n=602を中央登録・無作為割付した多施設前向きphase III randomized clinical trial (JCOG運営)。登録基準はECOG PS (Performance Status) 0-1、年齢20-74歳、stage IIIB (胸水・播種を含む) またはIV、測定可能病変 (>2cm)、十分な臓器機能 (好中球≥2,000/mm³、血小板≥100,000/mm³、Hb≥9.5g/dL、AST/ALT≤正常上限の2.5倍、Cr≤正常上限、creatinine clearance ≥60mL/分)。除外基準は症候性脳転移・中枢神経合併症・活動性感染症・重篤な合併症・他活動性悪性腫瘍。層別化因子はステージ・PS・性別・LDH値・アルブミン値・施設。各レジメンの詳細は以下の通り。IP群: CDDP 80 mg/m² day 1 + CPT-11 60 mg/m² day 1, 8, 15、4週サイクル。TC群: CBDCA AUC 6.0 day 1 + PTX 200 mg/m² day 1、3週サイクル。GP群: CDDP 80 mg/m² day 1 + GEM 1000 mg/m² day 1, 8、3週サイクル。NP群: CDDP 80 mg/m² day 1 + VNR 25 mg/m² day 1, 8、3週サイクル。全治療は最低3サイクル施行し、progressive disease (RECIST v1.0) または許容不能な毒性が生じるまで継続。試験はGCP (Good Clinical Practice) に準拠し、各施設のIRB (Institutional Review Board) 承認下に実施、全例から文書同意取得。主要評価項目は全生存期間 (OS)、非劣性マージン1年生存率の差 −10%。サンプルサイズは各群150例 (合計600例)、α=0.025 (one-sided)、検出力80%。副次評価項目は奏効率 (RECIST v1.0) ・奏効持続期間・TTP・TTTF・毒性 (NCI-CTC v2.0) ・QOL (Functional Assessment of Cancer Therapy-Lung (FACT-L) 日本語版およびQuality of Life Assessment of Cancer Therapy-Daily (QOL-ACD))。統計手法はKaplan-Meier法 + log-rank test (生存解析)、Cox proportional hazards regression (HR算出)、chi-square test (頻度比較)、Wilcoxon rank sum test (連続変数)、95% CI併記。中央委員会で奏効・有害事象を独立判定。