• 著者: Yoshiko Urata, Nobuyuki Katakami, Satoshi Morita, Reiko Kaji, Hiroshige Yoshioka, Takashi Seto, Miyako Satouchi, Yasuo Iwamoto, Masashi Kanehara, Daichi Fujimoto, Norihiko Ikeda, Haruyasu Murakami, Haruko Daga, Tetsuya Oguri, Isao Goto, Fumio Imamura, Shunichi Sugawara, Hideo Saka, Naoyuki Nogami, Shunichi Negoro, Kazuhiko Nakagawa, Yoichi Nakanishi
  • Corresponding author: Yoshiko Urata, MD (Hyogo Cancer Center, Department of Thoracic Oncology, Akashi, Japan)
  • 雑誌: Journal of Clinical Oncology
  • 発行年: 2016
  • Epub日: 2016-03-28
  • Article種別: Original Article
  • PMID: 27022112

背景

肺がんは世界的に癌関連死の主要な原因であり、非小細胞肺癌 (NSCLC) がその約85%を占め、腺癌が最も一般的な組織型であると報告されている Travis et al. JThoracOncol 2011。上皮成長因子受容体 (EGFR) チロシンキナーゼは、NSCLC、特に腺癌の重要な治療標的として確立されている。ゲフィチニブとエルロチニブは、ともにアニリノキナゾリン骨格を持ち、EGFRのATP結合ポケットに可逆的に結合する第一世代のEGFRチロシンキナーゼ阻害剤 (TKI) である。これらの薬剤は、EGFR遺伝子の体細胞変異、特にエクソン19欠失 (Ex19del) やL858R変異を有する患者において、高い奏効率と生存期間の延長を示すことが報告されている Lynch et al. NEnglJMed 2004Paez et al. Science 2004

ゲフィチニブは、日本のIDEAL1 (Iressa Dose Evaluation in Advanced Lung Cancer) 試験において日本人患者で高い奏効率 (27.5%) を示し、2002年に日本で二次治療以降の承認を得た Fukuoka et al. JClinOncol 2003Kris et al. JAMA 2003。しかし、大規模な第III相ISEL (Iressa Survival Evaluation in Lung Cancer) 試験では、既治療NSCLC患者において最良支持療法に対する生存期間の優位性を示すには至らなかった Shepherd et al. NEnglJMed 2005。一方、エルロチニブはBR.21試験において、既治療NSCLC患者の生存期間を延長し (中央値OS 6.7ヶ月 vs 4.7ヶ月; HR 0.70, p=0.001)、2007年に日本でも承認された Shepherd et al. NEnglJMed 2005

両薬剤は臨床現場で広く使用されてきたが、直接比較した前向き第III相試験は実施されておらず、特に日本では両薬剤が二次治療以降で使用可能であったため、その臨床的比較データが不足していた。ゲフィチニブとエルロチニブは構造的に類似しているものの、推奨用量における生物学的等価性や安全性プロファイルには未解明な点が多く、臨床現場での薬剤選択において重要な情報が不足している状況であった。本研究は、この知識ギャップを埋めることを目的として、既治療進行肺腺癌患者におけるゲフィチニブのエルロチニブに対する非劣性を検証する第III相試験として計画された。

目的

本研究 (WJOG5108L) は、EGFR-TKI前治療歴のない既治療進行肺腺癌患者を対象に、ゲフィチニブのエルロチニブに対する無増悪生存期間 (PFS) における非劣性を検証することを主要目的とした無作為化第III相試験である。副次目的として、全生存期間 (OS)、奏効率 (ORR)、疾患コントロール率 (DCR)、安全性プロファイル、および治療中止までの期間 (TTF) を比較評価した。また、EGFR変異陽性患者サブグループにおける有効性と安全性の比較も探索的に実施し、両薬剤の臨床的差異を詳細に検討することを目的とした。

結果

2009年7月から2012年10月にかけて、日本国内63施設から561名の患者が登録された。最終解析では、化学療法歴のない2名を除外し、ゲフィチニブ群に280名、エルロチニブ群に279名が割り付けられた (FAS: n=559)。患者の約70%がEGFR変異陽性であった。ベースラインの患者特性は、PSを除き両群間で良好にバランスが取れていた (Table 1)。安全性解析対象集団は、ゲフィチニブ群277名、エルロチニブ群276名であった。データカットオフ時 (2013年10月28日) において、各群の10.4%の患者が治験薬の投与を継続していた。治療中止の最も一般的な理由は病勢進行であった。毒性による治療中止は、ゲフィチニブ群で33名、エルロチニブ群で32名と同程度であった。追跡期間中央値は、ゲフィチニブ群で25.1ヶ月 (95% CI 22.1-30.1ヶ月)、エルロチニブ群で26.5ヶ月 (95% CI 21.9-35.1ヶ月) であった。

主要評価項目 (PFS・非劣性検定): 全解析集団 (FAS, n=559) におけるPFS中央値は、ゲフィチニブ群で6.5ヶ月 (95% CI 5.7-7.9ヶ月)、エルロチニブ群で7.5ヶ月 (95% CI 6.3-8.5ヶ月) であった。調整ハザード比 (HR) は1.125 (95% CI 0.940-1.347, p=0.257) であり、事前設定された非劣性マージン (HR < 1.30) を満たさなかったため、ゲフィチニブのエルロチニブに対する非劣性は証明されなかった (Fig 2A)。数値的にはエルロチニブ群でPFSが1ヶ月長い傾向が認められたが、統計的に有意な差ではなかった。治療中止までの期間 (TTF) 中央値は、ゲフィチニブ群で5.6ヶ月、エルロチニブ群で5.3ヶ月 (HR 1.032, 95% CI 0.866-1.231) と両群でほぼ同等であった。

全生存期間 (OS): OS中央値は、ゲフィチニブ群で22.8ヶ月 (95% CI 19.5-27.0ヶ月)、エルロチニブ群で24.5ヶ月 (95% CI 21.3-30.6ヶ月) であった (HR 1.038, 95% CI 0.833-1.294, p=0.768) (Fig 2B)。両群間に統計的に有意な差は認められなかった。両群ともに22〜24ヶ月という比較的良好なOSを示しており、これは患者集団の71.7%がEGFR変異陽性であったことを反映していると考えられる。

奏効率 (ORR) および疾患コントロール率 (DCR): ORRは、ゲフィチニブ群で45.9%、エルロチニブ群で44.1%であり、両群間に有意差はなかった (Table 2)。DCRは、ゲフィチニブ群で70.9%、エルロチニブ群で75.3%と、エルロチニブ群でわずかに高い傾向が観察されたが、統計的有意差はなかった。ランダムに抽出された患者のCT画像を盲検下で外部評価した結果も、同様の傾向を示した。

EGFR変異陽性サブグループ解析: EGFR変異陽性患者 (n=401) におけるPFS中央値は、ゲフィチニブ群で8.3ヶ月、エルロチニブ群で10.0ヶ月であった (HR 1.093, 95% CI 0.879-1.358, p=0.424) (Fig 4A)。このサブグループにおいても、両群間に統計的に有意なPFSの差は認められなかった。Ex19del変異単独患者 (ゲフィチニブ群n=90、エルロチニブ群n=102) では、PFS中央値はそれぞれ11.1ヶ月 vs 11.5ヶ月 (HR 1.120, 95% CI 0.813-1.544, p=0.487) であった (Fig 4B)。L858R変異単独患者 (ゲフィチニブ群n=92、エルロチニブ群n=80) では、PFS中央値はそれぞれ8.1ヶ月 vs 8.5ヶ月 (HR 0.938, 95% CI 0.675-1.304, p=0.704) であった (Fig 4C)。EGFR野生型患者 (n=98) におけるPFS中央値は、ゲフィチニブ群で2.0ヶ月 vs エルロチニブ群で1.7ヶ月であった (HR 1.270, 95% CI 0.847-1.904, p=0.241) (Fig 4D)。EGFR変異陽性サブグループ解析においても、治療と年齢の間に統計的に有意な交互作用は認められなかった (Fig 3B)。

安全性プロファイル: Grade 3または4の皮疹の発現率は、ゲフィチニブ群で2.2%であったのに対し、エルロチニブ群では18.1%と、エルロチニブ群で著明に高頻度であった (p<0.001) (Table 3)。一方、Grade 3または4のALT/AST上昇は、ゲフィチニブ群でそれぞれ6.1%/13.0%、エルロチニブ群で2.2%/3.3%と、肝機能障害はゲフィチニブ群で高頻度に観察された (p<0.001)。Grade 3または4の下痢は、エルロチニブ群でわずかに多い傾向が認められた。間質性肺疾患 (ILD) の発現率は両群ともに4%であり、エルロチニブ群で3名のGrade 5 ILDが報告されたが、両群間で有意差はなかった。全体的な最悪グレードの毒性 (あらゆる毒性) を比較すると、ゲフィチニブ群はエルロチニブ群よりも有意に低い毒性傾向を示した (p<001)。

考察/結論

WJOG5108L試験は、既治療進行肺腺癌患者においてゲフィチニブのエルロチニブに対するPFSにおける非劣性 (HR < 1.30) を証明するには至らなかった (HR 1.125, 95% CI 0.940-1.347)。しかし、両群間でPFS、OS、ORRに統計的に有意な差は認められず、両薬剤が同等の抗腫瘍活性を持つという臨床的印象と一致する結果であった。本研究の主要な知見は、両薬剤の安全性プロファイルにおける著明な差異である。特に、Grade 3/4の皮疹の発現率はエルロチニブ群で18.1%であったのに対し、ゲフィチニブ群では2.2%と、エルロチニブ群で約8倍高頻度であった。これは、エルロチニブの推奨用量 (150 mg) が、ゲフィチニブの最大耐用量 (250 mg) の生物学的等価用量を超えている可能性を示唆している。

先行研究との違い: これまでの第一世代EGFR-TKIに関する多くの研究は、プラセボや化学療法との比較であったが、本研究はゲフィチニブとエルロチニブという二つの第一世代EGFR-TKIを直接比較した初の第III相無作為化試験である点で、先行研究と異なる。特に、両薬剤の毒性プロファイルにおける明確な差異を大規模な臨床試験で示したことは、これまでの個別の薬剤評価では得られなかった重要な情報である。

新規性: 本研究で初めて、ゲフィチニブとエルロチニブの有効性が同等である一方で、重篤な皮膚毒性 (Grade 3/4皮疹) の発現率においてエルロチニブがゲフィチニブよりも著しく高いことが明確に示された。また、肝機能障害はゲフィチニブ群で高頻度であったことも新規の知見である。これらの毒性プロファイルの差異は、患者のQOLや治療継続性に実質的な影響を与えうる。

臨床応用: 本研究の結果は、EGFR変異陽性肺腺癌患者に対する第一世代EGFR-TKIの選択において、有効性だけでなく、毒性プロファイルを考慮することの臨床的意義を強調する。特に、皮膚毒性が懸念される患者に対しては、ゲフィチニブがより忍容性の高い選択肢となりうることを示唆している。現代ではオシメルチニブが一次治療として確立されており、ゲフィチニブやエルロチニブの二次治療での位置付けは変化しているが、本試験は第一世代TKI同士の直接比較という点で歴史的完結性を持つ。

残された課題: 本研究は非劣性試験としてデザインされたが、PFSの非劣性マージンを満たさなかったため、統計的な非劣性の結論には至らなかった。これは、試験デザインにおけるPFSの過小評価やサンプルサイズの不足が原因である可能性が指摘される。また、OSデータは未成熟であり、長期的な生存に関する明確な結論を導き出すにはさらなる追跡が必要である。今後の検討課題として、EGFR変異サブタイプごとの詳細な有効性・安全性プロファイルの比較や、T790Mなどの二次耐性変異の発現率とそれに続く治療戦略への影響に関する評価が残されている。

方法

本研究は、西日本腫瘍学グループ (WJOG) が日本国内の多施設で実施した、オープンラベル、多施設共同、無作為化第III相非劣性比較試験である (UMIN000002014)。対象患者は、組織学的または細胞学的に腺癌と診断されたStage IIIB/IVまたは術後再発の肺癌患者で、少なくとも1レジメン以上の化学療法歴があり、EGFR-TKI未投与、測定可能病変を有し、年齢20歳以上、ECOG PS 0〜2、十分な臓器機能を有することが条件とされた。主要な除外基準には、間質性肺炎の既往、活動性感染症、症候性脳転移などが含まれた。2011年12月のプロトコル改訂により、EGFR変異陽性患者のみが登録対象となった。

患者はゲフィチニブ250 mg/日群またはエルロチニブ150 mg/日群に1:1の割合で無作為に割り付けられた。無作為化は、性別、病期、EGFR変異ステータス、ECOG PS、喫煙歴、化学療法ライン数、施設を層別因子として中央動的無作為化法を用いて行われた。治療は病勢進行、許容できない毒性、または患者・医師の判断による中止まで継続された。用量減量は、エルロチニブでは100 mgおよび50 mg、ゲフィチニブでは隔日250 mgおよび3日に1回250 mgが可能であった。

主要評価項目は、治験責任医師がRECIST version 1.1に基づき評価したPFSであり、ゲフィチニブのエルロチニブに対する非劣性を検証することであった。非劣性マージンは調整ハザード比 (HR) の95%信頼区間 (CI) 上限が1.30未満と設定された。副次評価項目はOS、ORR、DCR、安全性、およびTTFであった。PFS、OS、TTFの生存曲線はカプラン・マイヤー法を用いて解析され、群間比較にはCox回帰モデルとログランク検定が用いられた。95% CIはBrookmeyer and Crowley法により算出された。患者特性および腫瘍奏効はχ2検定で比較され、毒性発現率はフィッシャーの正確検定で比較された。すべてのP値は両側検定であった。統計解析にはSAS for Windows, release 9.3が使用された。安全性評価はCommon Terminology Criteria for Adverse Events (CTCAE) version 3.0に従って行われた。