- 著者: Keunchil Park, Eng-Huat Tan, Ken O’Byrne, et al.
- Corresponding author: Keunchil Park (Samsung Medical Center, Sungkyunkwan University School of Medicine, Seoul, South Korea)
- 雑誌: Lancet Oncology
- 発行年: 2016
- Epub日: 2016-04-12
- Article種別: Original Article
- PMID: 27083334
背景
EGFR変異陽性非小細胞肺がん (NSCLC) は、特定の分子学的特徴を持つ肺がんの一種であり、EGFRチロシンキナーゼ阻害薬 (EGFR-TKI) が一次治療の選択肢として確立されている。第一世代の可逆的EGFR-TKIであるゲフィチニブやエルロチニブ、そして第二世代の不可逆的ErbBファミリー阻害薬であるアファチニブは、それぞれプラチナ製剤ベースの化学療法と比較して、無増悪生存期間 (PFS) の優越性、客観的奏効率 (ORR) の向上、および良好な安全性プロファイルを示すことが無作為化試験で報告されてきた。具体的には、ゲフィチニブはMok et al. NEnglJMed 2009、Maemondo et al. NEnglJMed 2010、Mitsudomi et al. LancetOncol 2010らの研究で、エルロチニブはRosell et al. LancetOncol 2012、Zhou et al. LancetOncol 2011らの研究で、アファチニブはSequist et al. JClinOncol 2013らの研究で、それぞれ化学療法に対する優越性が示されている。これらの薬剤は、EGFR遺伝子変異を持つ腫瘍細胞の増殖シグナル伝達経路を阻害することで、腫瘍の成長を抑制する。
しかし、これらの異なるEGFR-TKI間での直接的な有効性比較は、これまで主にメタ解析に限られており、有意な差は明確に示されていなかった。特に、アファチニブの不可逆的かつErbBファミリー全体(EGFR/HER2/ErbB3/ErbB4)に対する広範な阻害機序が、ゲフィチニブの可逆的EGFR選択的阻害と比較して、より優れた腫瘍制御をもたらすかどうかは、前向き無作為化試験では未検証であった。この知識ギャップは、EGFR変異陽性NSCLCの一次治療において最適なTKIを選択するための臨床的エビデンスが不足していることを意味した。従来のメタ解析では、第一世代EGFR-TKI間の有効性に有意差が示されていなかったため、第二世代TKIであるアファチニブが第一世代TKIと比較してどのような優位性を持つのかは未解明なままであった。この点が、臨床現場における治療選択の大きな課題として残されていた。
LUX-Lung 7試験は、この未解明な点を解決するために、第一世代TKIと第二世代TKIを直接比較した初めての国際多施設無作為化試験として計画された。本研究の目的は、EGFR変異陽性NSCLCの一次治療における最適なTKI選択に関する前向きエビデンスを提供し、アファチニブの広範な阻害機序が臨床的優位性をもたらすか否かを評価することであった。これにより、既存の治療選択肢の有効性と安全性をより詳細に理解し、患者の個別化医療に貢献することが期待された。特に、アファチニブの不可逆的結合とErbBファミリー全体への作用が、ゲフィチニブの可逆的かつEGFR選択的阻害と比較して、疾患進行をより効果的に抑制し、耐性メカニズムの出現を遅らせる可能性が示唆されていたため、その検証が強く求められていた。
目的
本研究の目的は、EGFR変異陽性(エクソン19欠失またはL858R)の進行NSCLC患者(治療未治療)を対象に、アファチニブ40mg/日とゲフィチニブ250mg/日の一次治療としての有効性および安全性を直接比較することである。共主要評価項目として、独立中央判定による無増悪生存期間 (PFS)、治療中止までの期間 (TTF)、および全生存期間 (OS) を設定した。これにより、不可逆的ErbBファミリー阻害薬であるアファチニブが、可逆的EGFR-TKIであるゲフィチニブと比較して、臨床的に意義のある優位性を示すか否かを評価することを意図した。本試験は、第一世代TKIと第二世代TKIを直接比較する初の無作為化試験として、それぞれの薬剤の作用機序の違いが臨床転帰に与える影響を明らかにすることを目指した。また、客観的奏効率 (ORR)、奏効持続期間 (DoR)、疾患制御率 (DCR)、腫瘍縮小率、安全性、患者報告アウトカム (QOL; EuroQoL-5DおよびEQ-VAS (EuroQoL EQ visual analogue scale)) などの副次評価項目も評価し、包括的な比較を行うことを目的とした。これらの評価を通じて、EGFR変異陽性NSCLCの一次治療における最適な薬剤選択に資するエビデンスを提供することが、本研究の重要な目的であった。
結果
試験規模と患者背景: 2011年12月13日から2013年8月8日までに571例がスクリーニングされ、319例が1:1で無作為化された(アファチニブ群 n=160、ゲフィチニブ群 n=159)。患者背景は両群間で概ね類似していたが、性別において女性の割合がゲフィチニブ群でやや高かった(アファチニブ群57% vs ゲフィチニブ群67%)。中央年齢は両群ともに63歳であった。アジア人患者の割合はアファチニブ群で59%、ゲフィチニブ群で55%であった。ECOG PS 1の患者が両群で約70%を占め、ステージIVの患者が95%以上であった。EGFR変異型はエクソン19欠失が58%、L858Rが42%であり、両群でバランスが取れていた。脳転移を有する患者はアファチニブ群で16%、ゲフィチニブ群で15%であった。治療期間中央値はアファチニブ群で13.7ヶ月 (IQR 7.4-24.3)、ゲフィチニブ群で11.5ヶ月 (IQR 6.2-18.8) であった。データカットオフ(2015年8月21日)時点で、アファチニブ群の69% (111例) およびゲフィチニブ群の75% (119例) が病勢進行により治療を中止していた (Figure 1, Table 1)。
主要評価項目① (PFS): 独立中央判定によるPFS中央値は、アファチニブ群で11.0ヶ月 (95% CI 10.6-12.9) であったのに対し、ゲフィチニブ群では10.9ヶ月 (95% CI 9.1-11.5) であった。ハザード比 (HR) は0.73 (95% CI 0.57-0.95, p=0.017) であり、アファチニブがゲフィチニブと比較して有意にPFSを延長し、共主要評価項目の一つを達成した (Figure 2A)。Kaplan-Meier曲線は中央値を過ぎると両群間の分離が顕著となり、12ヶ月PFS率 (47.4% vs 41.3%)、18ヶ月PFS率 (27.3% vs 15.2%)、24ヶ月PFS率 (17.6% vs 7.6%) と、すべての時点でアファチニブ群が高値を示し、長期にわたる継続的な疾患制御の差が確認された。担当医評価PFSでもアファチニブが有意に優越していた (HR 0.78, 95% CI 0.61-0.99, p=0.042)。事前設定されたサブグループ解析 (Figure 2B) では、EGFR変異型、脳転移の有無、PS、性別、年齢、人種、喫煙歴にかかわらず、概ね一貫してアファチニブ群で数値的に優越性が認められた。
主要評価項目② (TTF:治療中止までの期間): TTF中央値は、アファチニブ群で13.7ヶ月 (95% CI 11.9-15.0) であったのに対し、ゲフィチニブ群では11.5ヶ月 (95% CI 10.1-13.1) であった。ハザード比 (HR) は0.73 (95% CI 0.58-0.92, p=0.0073) であり、アファチニブ群で有意な延長が確認された (Figure 3A)。TTFはPFSと異なり、不耐容性による中止も含むため、アファチニブの治療継続性の優位性も示された。また、アファチニブ群の56例 (35%) およびゲフィチニブ群の47例 (30%) が放射線学的進行後も治療を継続しており、進行後の治療期間中央値はアファチニブ群で2.7ヶ月 (95% CI 1.94-4.3)、ゲフィチニブ群で2.0ヶ月 (95% CI 1.5-3.0) であった。
奏効率 (ORR) と奏効持続期間 (DoR): 独立中央判定によるORRは、アファチニブ群で70% (112/160例) であったのに対し、ゲフィチニブ群では56% (89/159例) であり、オッズ比 (OR) は1.87 (95% CI 1.18-2.99, p=0.0083) とアファチニブ群で有意に高率であった (Table 2)。完全奏効 (CR) は両群で各1例であった。奏効持続期間 (DoR) 中央値は、アファチニブ群で10.1ヶ月 (IQR 5.6-16.8)、ゲフィチニブ群で8.4ヶ月 (IQR 6.2-13.1) とアファチニブ群で延長傾向が認められた。奏効の82%は両群とも16週以内に初回記録された。疾患制御率 (DCR) はアファチニブ群で91% (146/160例)、ゲフィチニブ群で87% (139/159例) であり、有意差はなかった (p=0.24)。EGFR変異型別のORRでは、L858R変異患者においてアファチニブ群で66% vs ゲフィチニブ群で42%と、特にL858R患者での差が顕著であった (Figure 4)。
OS (共主要評価項目:中間データ): 本報告時点ではOSイベントはアファチニブ群で93例、ゲフィチニブ群で101例と未成熟であった。OS中央値はアファチニブ群で27.9ヶ月 (95% CI 25.1-32.2)、ゲフィチニブ群で25.0ヶ月 (95% CI 20.6-29.3) であった。ハザード比 (HR) は0.87 (95% CI 0.66-1.15, p=0.33) であり、有意差は認められなかった。後続治療の受療率は、アファチニブ群で75% (105/140例)、ゲフィチニブ群で81% (120/149例) であった。このうち、後続のEGFR-TKI治療を受けた患者はアファチニブ群で43% (60例)、ゲフィチニブ群で52% (78例) であった。第三世代EGFR-TKIの受療率は両群ともに9% (アファチニブ群12例、ゲフィチニブ群13例) とほぼ同等であった。
安全性 (有害事象): 全原因の有害事象の頻度と重症度は両群で類似していた(全グレード:アファチニブ群99% vs ゲフィチニブ群100%;Grade ≥3:アファチニブ群57% vs ゲフィチニブ群52%)。薬剤関連のGrade 3以上の有害事象は、アファチニブ群で31% (50例)、ゲフィチニブ群で17% (27例) であった。アファチニブ群で頻度が高かった主な薬剤関連Grade 3以上の有害事象は、下痢 (13%)、皮疹/ざ瘡 (9%)、疲労 (6%) であった。一方、ゲフィチニブ群ではALT/AST上昇 (9%)、皮疹/ざ瘡 (3%) が主なものであった (Table 4)。全グレードの有害事象では、アファチニブ群で下痢 (91% vs 61%)、口内炎 (64% vs 24%)、爪囲炎 (56% vs 17%) と皮膚粘膜毒性が顕著に高かった。間質性肺疾患 (ILD) はゲフィチニブ群のみで報告され、Grade 3が2例、Grade 4が1例であったが、Grade 5の死亡例はなかった。薬剤関連の重篤な有害事象はアファチニブ群で11% (17例)、ゲフィチニブ群で4% (7例) であった。用量減量はアファチニブ群で42% (67/160例) と多く行われたが、ゲフィチニブ群では2% (3/159例) にとどまった。これはゲフィチニブに規定の用量減量スキームがないためである。薬剤関連有害事象による治療中止は両群ともに10例 (6%) と同等であった。薬剤関連死亡はゲフィチニブ群で1例(肝腎不全)報告された。
考察/結論
LUX-Lung 7試験は、EGFR変異陽性NSCLCの一次治療において、不可逆的ErbBファミリー阻害薬アファチニブと可逆的EGFR-TKIゲフィチニブを直接比較した初めての無作為化試験である。本研究は、アファチニブがゲフィチニブと比較して、独立中央判定によるPFS (HR 0.73, 95% CI 0.57-0.95, p=0.017) およびTTF (HR 0.73, 95% CI 0.58-0.92, p=0.0073) を有意に延長することを示した。この結果は、アファチニブの広範かつ不可逆的なErbBファミリー阻害機序が、腫瘍制御において実際の優位性をもたらすことを初めて前向き試験で証明した点で新規性がある。
先行研究との違い: 過去のメタ解析では第一世代EGFR-TKI間の有効性に有意差は示されていなかったが、本研究は第一世代と第二世代TKIの直接比較により、第二世代TKIであるアファチニブの優越性を示した点で、これまでの知見と異なり、治療選択に新たなエビデンスを提供する。特に、PFS曲線が中央値を過ぎてからより顕著に分離したことは、アファチニブのより広範で持続的な阻害プロファイルが、ゲフィチニブと比較して耐性メカニズムの出現を遅らせる可能性を示唆する。これは、ErbB2やErbB3といった他のErbBファミリーメンバーが第一世代TKIへの獲得耐性に関与しているという知見と一致する。
新規性: 本研究で初めて、不可逆的pan-ErbBブロッカーが可逆的EGFR選択的阻害薬に対してPFSとTTFで優越することを示した。これは、アファチニブの作用機序が、EGFRのみならずHER2やErbB3といった他のErbBファミリーメンバーのシグナル伝達も阻害することで、腫瘍の増殖と生存をより効果的に抑制し、耐性メカニズムの発生を遅延させる可能性を示唆する。アファチニブはT790Mゲートキーパー変異を持つEGFRに対しても前臨床的に活性があることが報告されており、その広範な活性が今回の臨床的優位性につながったと考えられる。
臨床応用: 本知見は、EGFR変異陽性NSCLC患者の一次治療選択において重要な臨床的含意を持つ。PFS中央値の差は数値上小さいものの、ハザード比0.73は疾患進行または死亡リスクを27%低減することを示しており、特に長期的な疾患制御においてアファチニブが優位である可能性を示唆する。また、アファチニブの下痢や皮疹、ゲフィチニブの肝毒性(ALT上昇)といった異なる安全性プロファイルが示されたことは、患者個別の毒性プロファイルに基づいた治療選択の重要性を示す。TTFの延長は、放射線学的進行後も治療を継続する患者において、アファチニブが追加の臨床的利益をもたらす可能性を示唆する。これは、実臨床における治療継続の意思決定において重要な情報となる。
残された課題: 本研究の限界として、第2B相試験であるため、正式な事前定義された仮説がなく、3つの共主要評価項目に対して多重比較調整が行われていない点が挙げられる。また、本解析時点ではOSデータが未成熟であり、全生存期間におけるアファチニブの優位性は確立されていない。これは、一次治療後の効果的な後続治療(特に第三世代EGFR-TKIの登場)がOSに影響を与えた可能性も考えられる。今後の検討課題として、OSの最終解析結果が待たれる。さらに、オープンラベルデザインは一部の評価項目(TTFなど)にバイアスを導入した可能性も否定できないが、PFSやORRは盲検下で独立評価されているため、その影響は限定的であると考えられる。
方法
LUX-Lung 7は、国際多施設共同、非盲検、探索的、無作為化第2B相試験として、13カ国の64施設で実施された(ClinicalTrials.gov登録番号: NCT01466660)。患者登録期間は2011年12月13日から2013年8月8日までであった。
適格基準: 18歳以上の治療未治療のステージIIIBまたはIVの腺癌NSCLC患者で、共通のEGFR活性化変異(エクソン19欠失またはL858R)が局所または中央検査で確認されていることが求められた。ECOGパフォーマンスステータス (PS) は0または1、RECIST ver.1.1に基づく測定可能病変が少なくとも1つ存在し、十分な臓器機能を有することが条件とされた。主要な除外基準には、先行する全身化学療法またはEGFR標的薬治療、活動性の脳転移(症状があり治療を要する場合)、髄膜癌腫症、既存の間質性肺疾患などがあった。
無作為化と盲検化: 適格患者はアファチニブ群(40mgを1日1回経口投与)またはゲフィチニブ群(250mgを1日1回経口投与)に1:1で無作為に割り付けられた。無作為化はEGFR変異型(エクソン19欠失 vs L858R)とベースライン時の脳転移の有無(あり vs なし)で層別化された。治療割り付けは非盲検で行われたが、腫瘍反応の独立中央判定は盲検下で実施された。
治療プロトコル: アファチニブ群では、治療開始4週間後にGrade 1を超える皮疹、下痢、口内炎、その他の薬剤関連有害事象が認められない場合、50mgへの増量が許容された。Grade 3以上の薬剤関連有害事象、または2日以上持続するGrade 2の下痢、7日以上持続する悪心・嘔吐が認められた場合、治療は最大14日間中断され、Grade 1以下に回復後、10mg刻みで減量され、最低20mgまでとされた。ゲフィチニブ群では、承認用量である250mgを1日1回経口投与された。ゲフィチニブには用量減量スキームが規定されていなかったため、用量減量は行われず、治療中断のみが許容された。両群とも、病勢進行、忍容不能な有害事象、またはその他の理由で中止されるまで治療が継続された。放射線学的進行後も臨床的利益があると判断された場合は、治療継続が許容された。
評価項目:
- 共主要評価項目: 独立中央判定によるPFS、治療中止までの期間 (TTF)、全生存期間 (OS)。
- 副次評価項目: 客観的奏効率 (ORR)、奏効持続期間 (DoR)、疾患制御率 (DCR)、腫瘍縮小率、安全性、患者報告アウトカム (QOL; EuroQoL-5DおよびEQ-VAS)。
腫瘍評価と安全性評価: 腫瘍評価はCTまたはMRIにより、治療開始後4週、8週、その後64週までは8週ごと、それ以降は12週ごとに実施された。有害事象はNCI CTCAE ver.3.0に基づき評価された。安全性検査(血液学、血清生化学、凝固)はスクリーニング時、各治療サイクルの初回受診時、治療終了時、初回フォローアップ時に実施された。
統計解析: 本試験は探索的な第2B相試験であり、正式な仮説は設定されなかった。各治療群あたり約158例の患者を登録し、約250件のPFSイベントを収集することで、PFSのハザード比 (HR) の95%信頼区間 (CI) の幅を制御するよう計画された。PFS、TTF、OSの評価には、EGFR変異型とベースライン時の脳転移の有無で層別化されたログランク検定とCox比例ハザードモデルが用いられた。Kaplan-Meier法によりPFS、TTF、OSの中央値および95% CIが推定された。ORRおよびDCRの比較には、共変量で調整されたロジスティック回帰モデルが使用された。すべての統計的検定は両側検定で、有意水準は5%とされた。多重比較の調整は行われなかった。PFSの感度分析は、比例ハザードモデルを仮定しない制限付き平均生存時間 (restricted mean survival time) アプローチを用いて実施された。