• 著者: Nick Thatcher, Alex Chang, Purvish Parikh, et al.
  • Corresponding author: Nick Thatcher (Christie Hospital NHS Trust, Manchester, UK)
  • 雑誌: Lancet
  • 発行年: 2005
  • Epub日: N/A
  • Article種別: Original Article
  • PMID: 16257339

背景

非小細胞肺がん (NSCLC) は世界中で年間100万件以上の癌関連死を引き起こし、全肺がんの約80%を占める主要な死因である Parkin et al. CA Cancer J Clin 2005。当時の標準的な一次治療であるプラチナ製剤併用化学療法レジメンでは、OS中央値は7〜10ヶ月であった Kelly et al. JClinOncol 2001Scagliotti et al. JClinOncol 2002Schiller et al. NEnglJMed 2002。二次治療としてはドセタキセルが唯一の選択肢であり、OS中央値は5.7〜7.5ヶ月であったのに対し、最良の支持療法 (BSC) のみでは4.6〜5.6ヶ月であった Shepherd et al. JClinOncol 2000。三次治療の化学療法はほとんど効果がなく、Massarelliらによる後ろ向き解析では、最終治療開始からのOS中央値は4ヶ月と報告されている Massarelli et al. Lung Cancer 2003。これらの治療レジメンによるわずかな生存期間の延長は、しばしばその実質的な毒性によって相殺されており、既存の化学療法に不応または不耐の患者に対する新たな治療法の必要性が強く認識されていた。

上皮成長因子受容体 (EGFR) は、腫瘍細胞の増殖、浸潤、血管新生、転移、アポトーシスを制御するシグナル伝達経路の一部を形成する。EGFRはNSCLCで高頻度に過剰発現しており、EGFRを阻害する新規薬剤がこの疾患の潜在的な治療薬として開発されてきた。本研究の計画当時、EGFRチロシンキナーゼ阻害薬 (EGFR-TKI) であるゲフィチニブとエルロチニブの第II相臨床データが利用可能であった。ゲフィチニブ (250 mg/日) は、前治療歴のある進行NSCLC患者を対象とした2つの大規模第II相試験 (IDEAL 1およびIDEAL 2) のデータに基づき、進行NSCLC治療薬として承認された最初の分子標的薬であった Kris et al. JAMA 2003Fukuoka et al. JClinOncol 2003。これらの試験では、250 mg/日と500 mg/日のゲフィチニブで奏効率と生存期間に差はなかったが、高用量では有害事象の頻度と重症度が高かった。低用量では客観的奏効率 (ORR) は12〜18%であり、女性、非喫煙者、腺癌患者、および日本人患者でより高いORRが観察された。

ISEL (Iressa Survival Evaluation in Lung Cancer) 試験は、米国食品医薬品局 (FDA) が市販後試験として要求したものの1つであり、既存の化学療法レジメンに不応または不耐の進行NSCLC患者におけるゲフィチニブとBSCの生存期間延長効果を評価するためにデザインされた無作為化プラセボ対照第III相試験である。当時、EGFR変異の臨床的意義はまだ十分に解明されておらず、バイオマーカーによる患者選択は行われていなかった。同時期に実施された別のEGFR-TKIであるエルロチニブの第III相試験 (BR.21) が、組織型に関わらず全体集団でOSの有意な改善を示したことから Shepherd et al. NEnglJMed 2005、ISEL試験の独立データモニタリング委員会は、全体患者集団を腺癌患者集団と並ぶ共同主要評価項目として追加することを推奨した。これにより、ゲフィチニブが前治療歴のある難治性NSCLC患者の生存期間を改善するという仮説を検証することが目的とされたが、その効果が全体集団で認められるか、あるいは特定のサブグループに限定されるかが未解明であった。特に、ゲフィチニブの有効性を予測するバイオマーカーの特定は当時の知識では不足しており、大規模な実臨床データにおける有効性の確認が課題として残されていた。

目的

本研究の目的は、化学療法 (1〜2レジメン) 後に不応または不耐となった局所進行性または転移性非小細胞肺がん (NSCLC) 患者を対象に、ゲフィチニブ250mg/日と最良の支持療法 (BSC) の併用が、プラセボとBSCの併用と比較して、全生存期間 (OS) を改善するかどうかを評価することである。本試験は、ClinicalTrials.gov 登録番号 NCT1839IL/709 のもとで実施された。共同主要評価項目は、全体患者集団および腺癌患者集団におけるOSとした。副次評価項目は、治療失敗までの期間 (TTF)、客観的奏効率 (ORR)、生活の質 (QOL)、および忍容性とした。また、事前に計画されたサブグループ解析により、組織型、喫煙歴、民族などの因子がゲフィチニブの有効性に与える影響を検討することも目的とした。本試験は、FDAの市販後試験要求に応える形で、ゲフィチニブの有効性と安全性を大規模な患者集団で確認することを意図していた。

結果

試験規模と患者背景: 本試験には28カ国210施設から1692例の患者が無作為化され、ゲフィチニブ群に1129例、プラセボ群に563例が割り付けられた (Figure 1)。ベースライン時の患者特性は両治療群間で良好にバランスが取れていた (Table 1)。患者の約62%が男性、中央年齢は62歳であった。人種別では白人が68%、アジア人が20%を占めた。組織型は腺癌が48% (気管支肺胞上皮癌を含む)、扁平上皮癌が35%であった。非喫煙者は22% (n=375)、アジア人患者は20% (n=342) であった。WHOパフォーマンスステータスは0が12%、1が53%、2が29%、3以上が5%であった。前治療歴は1レジメンが49%、2レジメンが50%であり、90%の患者が最終化学療法に不応性であった。EGFR変異検査は当時日常臨床では実施されておらず、全例がバイオマーカー非選択の集団であった。中央追跡期間は7.2ヶ月であり、データカットオフまでに657例が死亡した。ゲフィチニブの曝露期間中央値は2.9ヶ月、プラセボは2.7ヶ月であった。プラセボ群からゲフィチニブへのクロスオーバー率は約3%と低かった。

全体集団における全生存期間 (OS) (主要評価項目①): 全体患者集団において、ゲフィチニブ群のOS中央値は5.6ヶ月 (95% CI 5.1-6.2ヶ月) であったのに対し、プラセボ群では5.1ヶ月 (95% CI 4.6-5.7ヶ月) であった。ハザード比 (HR) は0.89 (95% CI 0.77-1.02, p=0.087) であり、主要評価項目として設定された統計的有意水準 (p<0.05) を達成しなかった (Figure 2)。1年生存率はゲフィチニブ群で27%、プラセボ群で21%であった (p=0.067)。数値的には0.5ヶ月のOS中央値の改善が観察されたものの、統計的有意差には至らなかった。これは、EGFR変異陰性患者が大部分を占める集団において、ゲフィチニブの効果が希釈されたためと解釈された。

腺癌患者におけるOS (主要評価項目②): 腺癌患者集団 (n=812) において、ゲフィチニブ群のOS中央値は6.3ヶ月 (95% CI 5.7-7.2ヶ月) であったのに対し、プラセボ群では5.4ヶ月 (95% CI 4.7-6.2ヶ月) であった。HRは0.84 (95% CI 0.68-1.03, p=0.089) であり、こちらも統計的有意差は認められなかった。この結果、2つの共同主要評価項目はいずれも統計的有意性を達成できず、本試験は大規模なネガティブ試験として位置付けられた。ただし、サポート的なコックス回帰解析では、全体集団 (p=0.03) および腺癌集団 (p=0.033) の両方でゲフィチニブに有利な有意性が示唆された。

事前設定サブグループ解析: 非喫煙者およびアジア人患者におけるOSの有意な改善: 事前設定されたサブグループ解析では、喫煙歴と民族性において無作為化治療との有意な相互作用が認められた (Figure 4)。 非喫煙者サブグループ (n=375) では、ゲフィチニブ群のOS中央値は8.9ヶ月、プラセボ群は6.1ヶ月であり、ゲフィチニブ群で有意なOSの改善が認められた (HR 0.67, 95% CI 0.49-0.92, p=0.012)。1年生存率はゲフィチニブ群で41%、プラセボ群で25%であった。 アジア人患者サブグループ (n=342) では、ゲフィチニブ群のOS中央値は9.5ヶ月、プラセボ群は5.5ヶ月であり、ゲフィチニブ群で有意なOSの改善が認められた (HR 0.66, 95% CI 0.48-0.91, p=0.01)。 これらの結果は、非喫煙者およびアジア人患者という特定の集団において、ゲフィチニブが明確な生存利益をもたらす可能性を示唆した。これは、後にEGFR変異陽性患者がゲフィチニブに高感受性を示すこと、そして非喫煙者やアジア人患者にEGFR変異が高頻度で認められることと関連付けられる重要な知見となった。対照的に、白人患者 (HR 0.97) および現喫煙者/元喫煙者 (HR 0.95) では、OSに有意な差は認められなかった。

治療失敗までの期間 (TTF) と客観的奏効率 (ORR): 全体患者集団において、TTF中央値はゲフィチニブ群で3.0ヶ月、プラセボ群で2.6ヶ月であり、ゲフィチニブ群で有意なTTFの延長が確認された (HR 0.82, 95% CI 0.73-0.92, p=0.0006) (Figure 3)。治療失敗の主な原因は病勢進行であった (ゲフィチニブ群59.0%、プラセボ群70.5%)。 客観的奏効率 (ORR) は、ゲフィチニブ群で8.0%、プラセボ群で1.3%であり、ゲフィチニブ群で有意に高かった (オッズ比 7.28, 95% CI 3.1-16.9, p<0.0001) (Table 2)。探索的サブグループ解析では、非喫煙者、女性、腺癌患者、アジア人患者でゲフィチニブのORRがプラセボと比較して最も大きな差を示した。

生活の質 (QOL) と安全性: QOL評価には約85%の患者が参加し、ベースライン時のFACT-Lスコア中央値は87.5/136、肺癌サブスケール (LCS) スコア中央値は17.7/28であり、多くの患者が症状を有しQOLが損なわれていることが示された。全体集団では、QOLの変化は両群で類似していた (ベースラインからの平均変化 -3.66 vs -5.20, p=0.068)。しかし、症状スコアの改善はゲフィチニブ群で有意であった (LCSスコアの平均変化 -0.86 vs -1.38, p=0.019)。 安全性評価は1688例で実施された (Table 4)。ゲフィチニブ群の82%、プラセボ群の71%で少なくとも1つの有害事象が報告された。ゲフィチニブ群で最も頻繁に報告された有害事象は皮疹 (全グレード37%) と下痢 (全グレード27%) であり、ほとんどがグレード1または2であった。グレード3または4の有害事象の全体的な頻度は両群で類似していた (ゲフィチニブ群30%、プラセボ群27%)。間質性肺疾患 (ILD) 型の有害事象の頻度は両群で類似していた (1%)。治療関連死はゲフィチニブ群で5%、プラセボ群で4%であった。骨髄抑制は両群で最小限であった。アジア人患者では、全体集団と比較して有害事象の報告頻度がやや高く (ゲフィチニブ群97% vs 82%、プラセボ群86% vs 71%)、グレード3または4の有害事象の頻度もわずかに高かった (ゲフィチニブ群43% vs 30%、プラセボ群36% vs 27%)。アジア人患者におけるILD型イベントの頻度も全体集団より高かったが、ゲフィチニブ群とプラセボ群の間で差はなかった (3% vs 4%)。

考察/結論

ISEL試験は、前治療歴のある難治性進行NSCLC患者において、ゲフィチニブが全体患者集団および腺癌患者集団のいずれにおいても、全生存期間 (OS) を有意に改善しなかったという点で、大規模なネガティブ試験として記録される。この結果は、ゲフィチニブの第II相試験で観察された腫瘍縮小効果や、同時期に実施されたエルロチニブの第III相BR.21試験で全体集団におけるOSの有意な改善が示されたこと Shepherd et al. NEnglJMed 2005 と対照的であり、当初は失望を伴うものであった。

先行研究との違い: ISEL試験の主要評価項目が達成されなかった最大の理由は、当時の臨床試験設計においてEGFR変異の有無によるバイオマーカー選択がなされていなかったことにあると考えられる。すなわち、ゲフィチニブが効果を示さないEGFR変異陰性患者が試験母集団の大部分を占めていたため、全体としての効果が希釈されたと推測される。BR.21試験が全体集団でOS改善を示したこととの対比は、両試験の患者集団特性の違いで説明される可能性がある。ISEL試験では、より難治性の高い患者集団が組み入れられていた可能性も指摘されており、例えば、ISEL試験では90%の患者が最終化学療法に不応性であったのに対し、BR.21試験ではこの基準がなかった。また、ISEL試験では最終化学療法に奏効した患者が18%であったのに対し、BR.21試験では38%であった。

新規性: しかし、本研究で初めて、事前に計画されたサブグループ解析において、非喫煙者およびアジア人患者という特定の集団でゲフィチニブによるOSの有意な改善が示されたことは極めて重要な新規知見である。この知見は、EGFR変異が非喫煙者、アジア人、女性、および腺癌患者に高頻度で認められ、EGFR-TKIに対する劇的な奏効と関連しているという、その後のトランスレーショナル研究の結果 Lynch et al. NEnglJMed 2004Paez et al. Science 2004Pao et al. ProcNatlAcadSciUSA 2004 と強く一致する。本試験は、EGFR変異陽性NSCLC患者に対するEGFR-TKI治療というパラダイムを確立する上で、その後のバイオマーカー選択試験設計の科学的根拠を提供した歴史的な試験として位置付けられる。

臨床応用: ISEL試験の結果は、2005年6月の米国FDAによるゲフィチニブの新規患者への使用制限令につながった一方で、非喫煙者やアジア人患者における有効性の集中という知見は、EGFR変異がゲフィチニブの有効性を予測するバイオマーカーであるという仮説を強く支持し、その後のIPASS試験、NEJ002試験、WJTOG3405試験といったバイオマーカー選択型臨床試験の礎となった。これにより、EGFR変異陽性NSCLC患者に対する個別化医療の臨床応用への道が開かれた。

残された課題: 今後の検討課題として、EGFR変異以外のバイオマーカー (例: EGFR遺伝子増幅、K-Ras変異、B-Raf変異、EGFR発現レベルなど) とEGFR-TKIの奏効および生存期間との関係を明確にするための前向き研究が必要である。また、バイオマーカーの検出技術と解析方法の標準化も残された課題である。本試験のデータカットオフ後に追加で3ヶ月の追跡期間を設けた解析でも、全体集団および腺癌集団における生存結果に変化がなかったことから、追跡期間の延長によって結果が変わる可能性は低いと考えられる。

方法

本研究は、無作為化二重盲検プラセボ対照並行群間多施設共同第III相生存試験として、ヨーロッパ、アジア、中南米、オーストラリア、カナダの28カ国210施設で実施された。全ての患者は書面によるインフォームドコンセントを提供し、各施設倫理委員会の承認を得た上で、ヘルシンキ宣言およびGCPガイドラインに従って実施された。

患者選択基準: 18歳以上の組織学的または細胞学的に証明された局所進行性または転移性NSCLC患者で、外科手術または放射線療法による治癒が不可能であり、1〜2レジメンの化学療法歴があり、かつ最新の化学療法レジメンに不応 (最終化学療法投与後90日以内に再発または進行) または不耐であった患者が対象とされた。70歳未満の患者は少なくとも1レジメンのプラチナ製剤ベースの化学療法歴が必要であった。WHOパフォーマンスステータスは0〜2の患者が対象とされたが、パフォーマンスステータス3の患者も、その不良な状態が主に併存疾患によるものではないと治験責任医師が判断した場合に限り適格とされた。予想生存期間は8週間以上とされた。

除外基準: 小細胞肺がんの併存、最終化学療法からの期間不足、未治療または臨床的に不安定な中枢神経系転移、放射線療法関連の毒性残存、ゲフィチニブまたは賦形剤への重度過敏症、錠剤嚥下不能、他の悪性疾患 (基底細胞癌を除く)、特定の血液学的・生化学的異常、2レジメンを超える化学療法歴、EGFR阻害を主作用とする治験薬の使用歴、特定の併用禁止薬 (フェニトイン、カルバマゼピン、リファンピシン、バルビツール酸塩、セイヨウオトギリソウ)、重度または制御不能な全身性疾患、活動性間質性肺疾患、妊娠、授乳などが含まれた。

無作為化と治療: 患者はゲフィチニブ250mg/日またはプラセボ錠剤に2:1の比率で無作為に割り付けられた。無作為化は最小化法を用いて行われ、患者と治験責任医師の双方に盲検化を確保するため、物理的に同一の錠剤と包装が使用された。全ての患者は各施設の慣行に従って最良の支持療法を受けた。治験薬は許容できない毒性、同意撤回、または臨床的利益の喪失まで継続された。毒性管理のための最大14日間の用量中断が許容された。

評価項目: 主要評価項目は、全体患者集団および腺癌患者集団におけるOSとした。副次評価項目は、治療失敗までの期間 (TTF)、客観的奏効率 (ORR)、生活の質 (QOL)、および忍容性とした。OSは無作為化日から死亡日までと定義され、データカットオフ時に生存していた患者は最終生存確認日で打ち切られた。TTFは無作為化日から、許容できない毒性、臨床的利益の喪失、患者の選択、またはあらゆる原因による死亡により治療を中止した日までと定義された。RECIST基準による腫瘍評価はベースライン時に行われ、その後は少なくとも8週間ごとに実施することが推奨された。ORRは完全奏効と部分奏効の合計として算出された。QOLはFACT-L質問票を用いて4週間ごとに評価された。有害事象はNCI-CTC version 2.0に従ってモニタリングおよびグレード分類された。

統計解析: 当初、主要目的は腺癌患者におけるゲフィチニブの生存期間延長効果を評価することであった。90%の検出力で33%の生存期間改善を検出するために、696例の腺癌患者の死亡が必要とされた。しかし、BR.21試験の結果を受け、全体患者集団が共同主要評価項目に追加された。全体患者集団でエルロチニブと同様の生存期間改善を検出するために、少なくとも900例の死亡が必要と計算された。主要解析には層別ログランク検定 (log-rank test) が用いられ、組織型、喫煙歴、前化学療法失敗理由、前レジメン数、パフォーマンスステータス、性別で層別化された。サポート的なコックス回帰解析 (Cox regression analysis) も同様の共変量で調整して実施された。事前計画されたサブグループ解析には、喫煙歴、民族、組織型などが含まれた。サブグループにおける偽陽性所見のリスクを制限するため、厳密な統計的手法が用いられ、まずサブグループと無作為化治療との相互作用が評価された。