- 著者: Reck M, von Pawel J, Zatloukal P, Ramlau R, Gorbounova V, Hirsh V, Leighl N, Mezger J, Archer V, Moore N, Manegold C
- Corresponding author: Martin Reck, MD (Hospital Grosshansdorf, Grosshansdorf, Germany)
- 雑誌: Journal of Clinical Oncology
- 発行年: 2009
- Epub日: 2009-02-02
- Article種別: Original Article
- PMID: 19188680
背景
血管内皮増殖因子 (VEGF) は、腫瘍血管新生の主要なプロモーターであり、腫瘍の増殖と転移に不可欠な役割を果たすことが知られている。Ferrara et al. NatMed 2003 や Ferrara et al. NatRevDrugDiscov 2004 の研究で示されているように、非小細胞肺癌 (NSCLC) においては、VEGFの高発現がしばしば観察され、これは患者の不良な予後と関連することが複数の研究で報告されてきた。この知見に基づき、VEGFを標的とするヒト化モノクローナル抗体であるベバシズマブが開発され、大腸癌、乳癌、腎細胞癌といった様々な固形癌において臨床的有用性が確立されてきた。
NSCLC領域におけるベバシズマブの評価は、まず第II相試験から開始された。Johnson et al. JClinOncol 2004 が実施したランダム化第II相試験では、進行NSCLC患者を対象に、カルボプラチンとパクリタキセル (CP) の併用療法にベバシズマブ (7.5 mg/kgまたは15 mg/kg) を追加する群とCP単独群が比較された。この試験では、ベバシズマブ15 mg/kg群で無増悪生存期間 (TTP) の延長が示唆され、ベバシズマブのNSCLCにおける有効性の可能性が示された。しかし、この第II相試験では、主に扁平上皮癌患者において高頻度の肺出血が観察されたため、その後のベバシズマブのNSCLC試験では扁平上皮癌患者が除外されることとなった。
この有望な第II相試験の結果を受けて、Eastern Cooperative Oncology Group (ECOG) が主導する大規模な第III相試験E4599 (Sandler et al. NEnglJMed 2006) が実施された。この試験では、非扁平上皮NSCLCの初回治療として、ベバシズマブとCPの併用療法がCP単独療法と比較され、無増悪生存期間 (PFS) のハザード比 (HR) 0.66、全生存期間 (OS) のHR 0.79 (p=0.003) という有意な改善が示された。この画期的な結果に基づき、ベバシズマブ15 mg/kgは米国で非扁平上皮NSCLCの初回治療薬として承認された。
しかし、E4599試験では欧州で広く用いられているシスプラチンとゲムシタビン (CG) の併用療法とベバシズマブの組み合わせは検証されていなかった。また、ベバシズマブの2つの用量 (7.5 mg/kgと15 mg/kg) を直接比較した大規模なデータも不足しており、最適な用量設定に関する知見が不足していた。これらの臨床的ギャップを埋めるため、AVAiL試験が設計された。本試験の重要な設計上の特徴として、試験開始後にE4599の肯定的な結果が公表されたことを受け、主要評価項目が当初のOSからPFSに変更された点が挙げられる。これは、治療選択肢の迅速な提供と、後治療によるOS評価の交絡を避ける目的があったが、OSへの直接的な影響を評価する上で課題が残されている。特に、異なる化学療法レジメンとの併用におけるベバシズマブの有効性と安全性、および最適な用量に関するデータは未解明であった。
目的
AVAiL試験の目的は、未治療の進行非扁平上皮非小細胞肺癌 (NSCLC) 患者において、標準的なシスプラチンとゲムシタビン (CG) の併用化学療法に、血管内皮増殖因子 (VEGF) 阻害剤であるベバシズマブを7.5 mg/kgまたは15 mg/kgのいずれかの用量で追加することが、主要評価項目である無増悪生存期間 (PFS) を有意に延長するかどうかを検証することであった。本試験は、国際多施設共同の第III相臨床試験として、ベバシズマブの2つの異なる用量 (7.5 mg/kgと15 mg/kg) の有効性および安全性プロファイルを比較検討し、最適な用量設定に関する臨床的エビデンスを提供することも目的とした。
本試験は、先行するECOG 4599試験でベバシズマブとカルボプラチン/パクリタキセルの併用療法が非扁平上皮NSCLCの初回治療として有効性を示したことを踏まえ、欧州で広く使用されているCGレジメンとの組み合わせにおけるベバシズマブの有効性と安全性を評価することを意図した。特に、E4599試験ではベバシズマブの用量比較がなされていなかったため、AVAiL試験は両用量の直接的な比較は統計的に検出力不足であったものの、それぞれの用量がプラセボと比較してPFSを改善するかどうかを評価し、安全性プロファイルの違いを明らかにすることを目指した。これにより、ベバシズマブが異なるプラチナベースの化学療法レジメンと組み合わせても一貫した効果を示すか、また最適な用量が存在するかという重要な臨床的疑問に答えることを目指した。
結果
PFSの有意な延長: ベバシズマブの追加は、両用量においてプラセボと比較してPFSを有意に延長した。低用量ベバシズマブ (7.5 mg/kg) 群のPFS中央値は6.7ヶ月であったのに対し、プラセボ群では6.1ヶ月であり、ハザード比 (HR) は0.75 (95% CI 0.64-0.87, p=0.003) であった (Figure 3A)。高用量ベバシズマブ (15 mg/kg) 群のPFS中央値は6.5ヶ月であり、プラセボ群と比較してHR 0.82 (95% CI 0.69-0.96, p=0.03) であった (Figure 3B)。両ベバシズマブ群間の直接比較は、本試験の検出力不足のため統計的な結論は得られなかったが、HRの数値上は低用量群がわずかに優れる傾向を示した。
非プロトコル抗腫瘍療法 (NPT) を考慮した感度解析: 非プロトコル抗腫瘍療法 (NPT) を疾患進行前に受けた患者をセンサリングした感度解析では、PFSのHRはさらに良好であった。低用量ベバシズマブ群ではHR 0.68 (95% CI 0.56-0.83, p=0.0001)、高用量ベバシズマブ群ではHR 0.74 (95% CI 0.60-0.90, p=0.002) となり、これらのHRはECOG 4599試験のITT PFS HR 0.66と同水準であった。この解析は、後治療による交絡を排除し、ベバシズマブの純粋な効果を評価するために重要である。
客観的奏効率 (ORR) の改善: 客観的奏効率 (ORR) も、両ベバシズマブ群でプラセボ群と比較して有意に高かった。プラセボ群のORRは20.1%であったのに対し、低用量ベバシズマブ群では34.1% (p<0.0001)、高用量ベバシズマブ群では30.4% (p=0.0023) であった。奏効期間中央値は、プラセボ群で4.7ヶ月、低用量ベバシズマブ群で6.1ヶ月、高用量ベバシズマブ群で6.1ヶ月であった。
全生存期間 (OS) の中間データ: データカットオフ時点では、OSの評価に必要な709件の死亡イベントのうち356件 (50%) しか観察されておらず、OSデータは未成熟であったため、確定的結論は得られなかった。その後の最終OS解析 (Reck et al. 2010) では、低用量ベバシズマブ群でHR 0.93、高用量ベバシズマブ群でHR 1.03と、統計的に有意なOS改善は示されなかった。
サブグループ解析におけるPFSの一貫した改善: 年齢、性別、ECOG PS、病期、地域、組織型を含む様々なサブグループにおいて、ベバシズマブの一貫したPFS改善傾向が認められた (Figure 4)。高齢患者や異なる地域間でも、ベバシズマブのPFSに対する効果に大きな異質性は観察されなかった。これは、ベバシズマブの有効性が広範な患者集団に及ぶ可能性を示唆する。
安全性プロファイル: 全体的な安全性プロファイルは、以前のNSCLCにおけるベバシズマブ臨床試験で観察されたものと類似していた (Table 3)。Grade ≥3の有害事象 (AE) の発現率は、プラセボ群で75%、低用量ベバシズマブ群で76%、高用量ベバシズマブ群で81%であり、高用量群でわずかに高かった。重篤な有害事象 (SAE) の発現率は、プラセボ群と低用量ベバシズマブ群でそれぞれ35%であったのに対し、高用量ベバシズマブ群では44%と高かった。
血液毒性: Grade ≥3の好中球減少症は、プラセボ群で32%、低用量ベバシズマブ群で40%、高用量ベバシズマブ群で36%に認められた。血小板減少症はそれぞれ23%、27%、23%、貧血は13%、10%、10%であった。発熱性好中球減少症は、プラセボ群で1%、低用量ベバシズマブ群で2%、高用量ベバシズマブ群で2%に発生した。
非血液毒性およびベバシズマブ特異的毒性: ベバシズマブ群でより多く報告されたGrade ≥3の非血液毒性には、高血圧 (プラセボ2% vs 低用量6% vs 高用量9%)、嘔吐 (4% vs 7% vs 9%)、無力症 (3% vs 5% vs 5%) が含まれた。ベバシズマブ特異的な有害事象として、出血 (プラセボ2% vs 低用量4% vs 高用量4%)、蛋白尿 (プラセボ0% vs 低用量<1% vs 高用量1%) がベバシズマブ群で増加した。消化管穿孔はプラセボ群で<1%、高用量ベバシズマブ群で<1%に発生したが、低用量ベバシズマブ群では報告されなかった。動脈血栓塞栓事象はプラセボ群で5%、低用量ベバシズマブ群で2%、高用量ベバシズマブ群で3%であり、静脈血栓塞栓事象はそれぞれ6%、7%、7%であった。
肺出血の発生率: Grade ≥3の肺出血は、プラセボ群で2例 (0.6%)、低用量ベバシズマブ群で5例 (1.5%)、高用量ベバシズマブ群で3例 (0.9%) に観察された。致死的な肺出血は、プラセボ群で1例 (0.3%)、低用量ベバシズマブ群で4例 (1.2%)、高用量ベバシズマブ群で3例 (0.9%) であった。全グレードの喀血は、プラセボ群で5.2%、低用量ベバシズマブ群で7.0%、高用量ベバシズマブ群で9.7%に認められた。肺出血イベント10件のうち4件は、腫瘍が中心部に位置する患者で発生しており、これは全試験集団における中心部腫瘍の割合 (38%) と一致していた。また、試験開始時に治療用抗凝固療法を受けていた患者が9%いたが、これらの患者では肺出血は観察されなかった。全体的な肺出血率は、ECOG 4599試験 (ベバシズマブ群で1.9%) と同水準であり、以前の第II相試験 (扁平上皮癌患者を含むため高率であった) より明らかに低かった。
考察/結論
AVAiL試験は、ECOG 4599試験に続く大規模な第III相試験として、シスプラチンとゲムシタビン (CG) の併用化学療法にベバシズマブを追加することで、進行非扁平上皮非小細胞肺癌 (NSCLC) 患者の無増悪生存期間 (PFS) と客観的奏効率 (ORR) が有意に改善されることを実証した。この結果は、ベバシズマブが異なるプラチナベースの化学療法レジメンと組み合わせても一貫した抗腫瘍効果を発揮することを示しており、複数の重要な観点から臨床的意義を持つ。
先行研究との違い: 本試験の結果は、Sandler et al. NEnglJMed 2006 が報告したE4599試験 (カルボプラチン/パクリタキセルとベバシズマブの併用) の結果と一致しており、ベバシズマブの抗腫瘍効果が特定の細胞傷害性薬剤との相乗効果ではなく、血管内皮増殖因子 (VEGF) 経路の抑制自体に由来することを示唆する。E4599試験とは異なり、AVAiL試験では欧州で標準的なCGレジメンが用いられたが、両試験でPFSの改善が認められたことは、ベバシズマブが様々なプラチナベースの化学療法と組み合わせ可能であることを確立した。特に、NPTを考慮した感度解析におけるPFSのハザード比 (HR) は、低用量ベバシズマブ群で0.68 (95% CI 0.56-0.83, p=0.0001)、高用量ベバシズマブ群で0.74 (95% CI 0.60-0.90, p=0.002) であり、E4599試験のPFS HR 0.66と同水準であったことは、ベバシズマブの汎用性を定量的に裏付けるものである。
新規性: 本研究は、ベバシズマブの2つの用量 (7.5 mg/kgと15 mg/kg) をプラセボと比較した初めての大規模第III相試験であり、両用量ともにPFSとORRの有意な改善を示した。直接比較の検出力は不足していたものの、PFSのHR (0.75 vs 0.82) およびORR (34.1% vs 30.4%) の数値上では低用量ベバシズマブ群がわずかに優れる傾向を示した。安全性プロファイルにおいては、高血圧 (6% vs 9%) や蛋白尿 (<1% vs 1%) のGrade ≥3有害事象が高用量群でより高頻度に観察され、重篤な有害事象 (SAE) の発現率も高用量群 (44%) がプラセボ/低用量群 (35%) より高かった。これらの結果に基づき、リスクとベネフィットのバランスを考慮すると、7.5 mg/kgのベバシズマブがより適切な用量であると判断され、欧州での承認用量として確立された。これは、本研究で初めて示された重要な知見である。
臨床応用: 本試験の結果は、非扁平上皮NSCLCの初回治療において、ベバシズマブとプラチナベース化学療法の併用が新たな標準治療選択肢となる強力な根拠を提供した。特に、扁平上皮癌の除外、出血・凝固障害の既往歴の除外、主要血管に隣接・浸潤する腫瘍の除外といった厳格な患者選択基準が、ベバシズマブの主要な懸念事項である肺出血のリスクを管理可能な範囲 (Grade ≥3肺出血率1.5%) に抑える上で有効であったことが確認された。治療用抗凝固療法を受けていた患者 (9%) で肺出血が観察されなかったという知見は、慎重に選択された患者においては、抗凝固療法がベバシズマブ使用の絶対的禁忌ではない可能性を示唆しており、臨床現場での治療選択に重要な含意を持つ。
残された課題: しかし、本試験にはいくつかのlimitationも存在する。最も重要なのは、主要評価項目が当初のOSからPFSに変更されたことで、最終的にOSの有意な改善が示されなかった点である。これは、PFSをサロゲートエンドポイントとした承認の妥当性に関する論争を生み、患者にとっての真の利益であるOS改善が直接的に確認されない中でのPFSベースの承認は、臨床試験デザインにおけるエンドポイント選択の重要な教訓となった。後治療 (ベバシズマブを含む) の使用や検出力不足がOSの結果に影響を与えた可能性が考えられる。今後の検討課題として、ベバシズマブの長期的な安全性プロファイルや、分子標的薬や免疫チェックポイント阻害薬との併用療法における役割のさらなる解明が挙げられる。また、本試験の患者集団は年齢中央値が57-60歳とE4599試験 (63歳) より若く、主要血管に隣接する腫瘍が除外されるなど、比較的良好な予後因子を持つ患者が選択された可能性があり、プラセボ群のPFS中央値が6.1ヶ月と比較的良好であった。このため、絶対的なPFS延長 (0.4-0.6ヶ月) の臨床的意義が十分であるかという議論も残されている。
方法
試験デザインと実施: AVAiL試験 (NCT00115704) は、国際多施設共同の3群ランダム化二重盲検プラセボ対照第III相試験として設計された。2005年2月から2006年8月にかけて、20カ国の150施設で実施された。本試験は、当初OSを主要評価項目とする2段階適応デザインで開始されたが、E4599試験の肯定的なOS結果を受けて、主要評価項目がPFSに変更された。この変更は、試験の完了を確実化し、有効性データの迅速な報告を可能にすることで、患者への治療選択肢の提供を加速する目的があった。また、後治療 (特にプラセボ群患者のベバシズマブへの非プロトコルクロスオーバーを含む) によるOS評価の交絡リスクを回避する意図もあった。
患者適格基準:
- 組み入れ基準: 組織学的または細胞学的に確定診断された進行期 (Stage IIIB [鎖骨上リンパ節転移または悪性胸水・心嚢水を含む] または Stage IV) または再発の非扁平上皮NSCLC患者。年齢18歳以上、ECOG Performance Status (PS) 0-1、適切な造血機能、肝機能、腎機能を有することが求められた。
- 除外基準: 扁平上皮癌または扁平上皮成分が優位な混合腺扁平上皮癌、Grade ≥2の喀血歴 (鮮血1/2ティースプーン以上)、中枢神経系 (CNS) 転移、血栓性または出血性疾患の既往、登録時の治療用抗凝固療法 (ただし、試験期間中の静脈血栓症治療のための全量抗凝固療法は許容された)、アスピリン (325 mg/日超) の現在および最近の使用、臨床的に有意な心血管疾患、医学的にコントロールされていない高血圧、治癒していない創傷・潰瘍・骨折、治療前4週間以内の胸部外骨病変に対する緩和的放射線療法、治療前4週間以内の手術、妊娠または授乳中の患者。さらに、画像診断に基づき、主要血管に隣接または浸潤する腫瘍を有する患者も除外された。
無作為化と盲検化: 適格患者は、プラセボ群 (n=347)、低用量ベバシズマブ群 (7.5 mg/kg、n=345)、高用量ベバシズマブ群 (15 mg/kg、n=351) の3群に1:1:1の比率で無作為に割り付けられた。層別化因子は、地域 (西欧/オーストラリア/カナダ、東欧、東アジア、中南米)、病期 (IIIB、IV、再発)、ECOG PS (0または1)、性別であった。試験の盲検性を維持するため、プラセボ群は高用量プラセボと低用量プラセボに分けられ、各施設はベバシズマブとプラセボの区別については盲検化されたが、用量レベルについては非盲検であった。解析時には高用量と低用量のプラセボ群は統合された。
治療レジメン:
- 共通化学療法: 全ての患者は、シスプラチン80 mg/m² (Day 1) とゲムシタビン1,250 mg/m² (Day 1およびDay 8) を3週間サイクルで最大6サイクル投与された。
- ベバシズマブ/プラセボ: ベバシズマブまたはプラセボは、化学療法と同時に3週間ごとにDay 1に静脈内投与された。
- 維持療法: プロトコル改訂前は、6サイクルの化学療法完了後、ベバシズマブ群は単剤ベバシズマブ維持療法を継続し、プラセボ群は疾患進行まで観察された。プロトコル改訂後は、全ての患者が疾患進行または許容できない毒性が生じるまで、盲検化された単剤ベバシズマブまたはプラセボの投与を継続した。プラセボ群からベバシズマブ群へのクロスオーバーは許可されなかった。
評価項目:
- 主要評価項目: 無増悪生存期間 (PFS)。無作為化からRECIST (Response Evaluation Criteria in Solid Tumors) 基準に基づく疾患進行または死亡までの期間と定義され、ITT (intent-to-treat) 解析集団で評価された。
- 副次評価項目: 客観的奏効率 (ORR)、奏効期間、全生存期間 (OS、データカットオフ時点では未成熟)、安全性プロファイル。
統計解析: 本試験は当初、OSを主要評価項目とする2段階適応デザインで開始されたが、E4599試験の肯定的なOS結果を受けて、主要評価項目がPFSに変更された。PFS解析は、ログランク検定 (log-rank test) を用いて行われ、多重性補正のために閉鎖型検定手順 (closed test procedure) が適用された。データカットオフは2006年10月7日であり、この時点で665件のPFSイベントと356件の死亡が観察された。OS解析は、709件の死亡イベントが観察された後に実施される計画であった。ORRの比較には、Schouten補正を伴うカイ二乗検定が用いられた。
患者背景: 無作為化された1,043名の患者のベースライン特性は、3群間でバランスが取れていた (Table 1)。年齢中央値は57-59歳であり、男性が62-65%、ECOG PS 0が38-41%、Stage IVが77%を占めた。組織型は腺癌が82-85%と最も多かった。地域別では、西欧/オーストラリア/カナダが54-55%、東欧が31-32%、東アジアが8-9%であった。主要血管に隣接または浸潤する腫瘍を有する患者が除外されたため、より良好な予後を持つ患者集団が選択された可能性がある。