- 著者: Zhu J, Sharma DB, Gray SW, Chen AB, Weeks JC, Schrag D
- Corresponding author: Deborah Schrag, MD, MPH (Center for Outcomes and Policy Research, Dana-Farber Cancer Institute, Boston, MA, USA)
- 雑誌: JAMA
- 発行年: 2012
- Epub日: 2012-04-18
- Article種別: Original Article (retrospective cohort study)
- PMID: 22511687
背景
進行非小細胞肺癌 (NSCLC) は、診断時にすでに進行期 (AJCC 第6版における IIIB 期またはIV期) であることが多く、治癒が困難な疾患である。化学療法は最良の支持療法と比較して生存期間やQOLを有意に改善するものの、1年生存率は50%未満、3年生存率は25%未満と予後は依然として厳しい。腫瘍血管新生を阻害する抗VEGF抗体であるベバシズマブは、2006年に発表された ECOG (Eastern Cooperative Oncology Group) 4599試験 (Sandler et al. NEnglJMed 2006) において、カルボプラチン (CP) +パクリタキセル (paclitaxel) 療法への上乗せにより、全体生存期間 (OS) を有意に改善することが示された。同試験では、ベバシズマブ併用群で OS のハザード比が HR 0.79 (95% CI 0.67-0.92) と報告され、FDA により2006年10月に進行非扁平上皮NSCLC治療薬として承認された。
しかし、ECOG 4599試験の65歳以上の高齢者サブグループ解析 (Ramalingam et al. JClinOncol 2008) では、ベバシズマブ上乗せによる生存ベネフィットは観察されず (HR 0.89, 95% CI 0.70-1.14)、70歳以上の患者サブセットでも有意な生存改善は示されなかった (11.3 vs 12.1 ヶ月)。さらに、化学療法単独の生存改善効果を示したメタアナリシス (NSCLC et al. JClinOncol 2008) では、ベバシズマブ追加による1年生存率の有意な改善は同定されなかった。このように、高齢者におけるベバシズマブの有効性は未解明であり、議論が続く controversial な領域であった。
肺癌患者の約3分の2は65歳以上で診断されるため、高齢者におけるベバシズマブの有効性と安全性の検証は極めて重要な課題である。それにもかかわらず、高齢患者を対象とした大規模な実臨床データに基づく検証は不足しており、高齢者におけるベバシズマブの真の治療効果は不明なままであった。臨床試験に参加する患者は一般に若く、合併症が少なく、全身状態が良好に選別されているのに対し、実臨床の Medicare 受給者コホートはより高齢であり、多くの合併症を抱えている。このような患者集団では、ベバシズマブに伴う毒性 (高血圧、蛋白尿、出血、血栓塞栓症など) のリスクが高く、治療によるベネフィットが相殺される可能性が考えられる。高齢者における実臨床データの蓄積が決定的に不足しているという課題が存在していた。
目的
本研究の目的は、米国のがん登録データベースである SEER (Surveillance, Epidemiology, and End Results) と高齢者向け医療保険制度である Medicare の連結データベース (SEER-Medicare) を用いて、実臨床における65歳以上の進行非扁平上皮NSCLC高齢患者を対象に、1次治療としてのカルボプラチン+パクリタキセルへのベバシズマブ上乗せである BCP (bevacizumab, carboplatin, and paclitaxel) 療法が、カルボプラチン+パクリタキセル単独である CP 療法と比較して全体生存期間 (OS) を改善するかどうかを検証することである。特に、ランダム化比較試験 (RCT) とは異なり、実臨床データに特有の選択バイアスや交絡因子を制御するため、傾向スコア (propensity score) を用いた複数の調整モデルを適用し、高齢者におけるベバシズマブの有効性を多角的に評価・比較することを目的とする。また、実臨床におけるベバシズマブの採用率と治療選択パターンを明らかにし、医師の治療選択に影響を与える患者背景因子を同定することも重要な目的である。
結果
実臨床におけるベバシズマブの採用状況と患者背景:
初期サンプル59,770例から、段階的に除外基準を適用し、最終的に4,168例が解析対象となった (Fig 1)。ベバシズマブ承認後の2006-2007年に診断された患者は1,502例であり、そのうちBCP療法を受けたのは318例 (21%)、CP療法を受けたのは1,182例 (79%) であった。2007年単独でのベバシズマブ採用率は22%にとどまり、実臨床での導入は限定的であった。
患者背景の比較において、BCP群はCP群 (2006-2007年) と比較して、合併症スコアが2以上の割合が有意に低く (6.3% vs 16.3%, p<0.001)、IV期症例の割合が有意に高かった (82.4% vs 70.9%, p<0.001)。また、ベバシズマブ承認前の2002-2005年のCP群との比較においても、BCP群は合併症スコアが2以上の割合が有意に低く (6.3% vs 13.0%, p=0.002)、IV期症例の割合が有意に高く (82.4% vs 69.4%, p<0.001)、良好に分化した腫瘍の割合が有意に高かった (15.7% vs 10.4%, p=0.01)。これらの不均衡は、実臨床において医師がより若く合併症の少ない患者に対してベバシズマブを選択する傾向 (選択バイアス) を反映している。年齢、性別、人種/民族、婚姻状態、所得、教育水準、SEER 地域、都市部居住に関しては、治療群間に有意な差は認められなかった。傾向スコア層別化後、観察された共変量のバランスが改善し、傾向スコアマッチング後には、測定可能な特性においてほぼ全て均衡した (診断時年齢を除く)。
全体生存期間の未調整解析:
Kaplan-Meier 生存曲線解析において (Fig 2)、生存期間中央値 (mOS) はBCP群で9.7ヶ月 (IQR 4.4-18.6)、2006-2007年のCP群で8.9ヶ月 (IQR 3.5-19.3)、2002-2005年のCP群で8.0ヶ月 (IQR 3.7-17.2) であった。1年生存率はBCP群で39.6% (95% CI 34.6-45.4%) vs 2006-2007年のCP群で40.1% (95% CI 37.4-43.0%)、2002-2005年のCP群で35.6% (95% CI 33.8-37.5%) であった。未調整の群間比較ではBCP群とCP群 (2006-2007年) の間に有意な生存差は認められず、むしろ1年生存率はほぼ同等であった。
多変量調整および傾向スコア調整解析:
多変量調整コックス回帰モデルにおいて、BCP群のCP群 (2006-2007年) に対するOSのハザード比は HR 1.01 (95% CI 0.88-1.15, p=0.92) であり、生存期間の有意な改善は認められなかった。また、ベバシズマブ承認前の2002-2005年のCP群との比較においても、調整ハザード比は HR 0.94 (95% CI 0.83-1.06, p=0.31) と有意差はなかった (Table 2)。
選択バイアスを補正するための傾向スコア解析においても、ベバシズマブの上乗せ効果は一貫して否定された。傾向スコア層別化モデルにおけるBCP群 vs CP群 (2006-2007年) のOSハザード比は HR 1.01 (95% CI 0.89-1.16, p=0.85) であり、有意差は認められなかった。傾向スコア回帰調整モデルでも HR 1.01 (95% CI 0.89-1.16) と同様の結果が得られた。安定化逆確率治療重み付け (IPTW) モデルでは HR 0.99 (95% CI 0.87-1.13, p=0.88)、1:1傾向スコアマッチングモデル (各群n=318) でも HR 0.99 (95% CI 0.79-1.23, p=0.93) と、いずれの統計モデルを用いてもベバシズマブによる生存ベネフィットは示されなかった。ベバシズマブ承認前コホート (2002-2005年) との比較でも、傾向スコア層別化モデルで HR 0.93 (95% CI 0.83-1.06, p=0.28)、IPTW モデルで HR 0.93 (95% CI 0.82-1.06)、マッチングモデルで HR 0.90 (95% CI 0.72-1.13) と有意差はなかった。
サブグループ解析による頑健性の検証:
病期および合併症によるサブグループ解析でも同様の結果が得られた。IV期患者のみを対象とした解析において、BCP群 vs CP群 (2006-2007年) のOSハザード比は HR 0.96 (95% CI 0.83-1.12, p=0.62) であり、ベバシズマブ承認前コホートとの比較では HR 0.88 (95% CI 0.77-1.02) であった。また、合併症スコアが0の患者に限定した解析でも、ハザード比は HR 1.04 (95% CI 0.87-1.23, p=0.68) と有意差を認めなかった。
感度解析による結果の堅牢性:
治療開始後8日以上生存した患者のみを対象とした感度解析 (HR 1.00 (95% CI 0.87-1.15, p=0.95)) や、ベバシズマブ併用の定義を30日以内に拡大した解析 (HR 0.98 (95% CI 0.86-1.12, p=0.78)) でも、結果の頑健性が確認された。不死時間バイアスの影響を評価した複数の感度解析において、いずれもベバシズマブの生存ベネフィットは示されなかった。
生存に関連する他の予後因子の解析:
コホート全体における他の臨床的・社会的因子とOSとの関連を評価したところ、いくつかの因子が生存期間と有意に関連していることが示された (Table 3)。男性は女性と比較して死亡リスクが有意に高く (HR 1.37 (95% CI 1.23-1.54, p<0.001))、病期においてはIIIB期と比較してIV期で死亡リスクが有意に高かった (HR 1.57 (95% CI 1.38-1.78, p<0.001))。腫瘍の分化度においては、高/中分化と比較して低分化/未分化で予後不良であった (HR 1.57 (95% CI 1.29-1.92, p<0.001))。既婚者は未婚者と比較して生存が良好であり (HR 0.88 (95% CI 0.78-0.98, p=0.02))、所得が最も高い層 (第5五分位) も最も低い層 (第1五分位) と比較して死亡リスクが低かった (HR 0.77 (95% CI 0.64-0.94, p=0.01))。これらの予後因子の同定は、ベバシズマブ以外の臨床的・社会的因子がNSLCL患者の生存に与える影響の大きさを示唆している。
考察/結論
先行研究との違い:
本研究は、ベバシズマブの生存ベネフィットを示した ECOG 4599試験 (Sandler et al. NEnglJMed 2006) の全体結果と異なり、高齢者集団においてはベバシズマブの上乗せが生存期間を改善しないことを実臨床データから明らかにした。ECOG 4599試験の高齢者サブグループ解析 (Ramalingam et al. JClinOncol 2008) でも生存改善は示されていなかったが、本研究は実臨床の大規模コホートを用いてその知見を裏付ける結果となった。ECOG 4599試験では、全体で HR 0.79 の生存改善が示されたのに対し、本研究では HR 1.01 と改善が認められず、むしろ同等の生存期間であった。治験に参加する高度に選択された高齢患者と対照的に、実臨床の Medicare 受給者コホートはより高齢であり (100% が65歳以上、3分の1以上が75歳以上)、多くの合併症を抱えている。ECOG 4599試験では44%の患者が65歳以上であったのに対し、本研究では全患者が65歳以上であり、より高齢で脆弱な集団を代表している。このような実臨床の高齢患者では、ベバシズマブに伴う毒性 (高血圧、蛋白尿、出血、血栓塞栓症など) のリスクが高く、治療によるベネフィットが相殺された可能性が考えられる。
新規性:
本研究は、SEER-Medicare という大規模な実臨床データベースを用い、傾向スコアを用いた複数の高度な統計手法 (層別化、マッチング、IPTW など) を駆使して、高齢NSCLC患者におけるベバシズマブの有効性を本研究で初めて包括的に検証した。これまで報告されていない実臨床におけるベバシズマブの実際の採用率 (約20%) や、医師がより若く合併症の少ない患者に対してベバシズマブを選択するという治療選択バイアスの実態を新規に明らかにした点も重要である。本研究は、臨床試験の結果が実臨床の高齢患者集団に必ずしも外挿できないことを示す重要な証拠を提供した。
臨床応用:
本知見の臨床的意義として、高齢の進行非扁平上皮NSCLC患者に対する治療選択において、ベバシズマブを画一的に標準治療として推奨すべきではないことが示唆される。臨床現場においては、患者の年齢、合併症、全身状態 (performance status) を慎重に評価し、ベバシズマブの追加に伴うリスクとベネフィットを個別化して判断する必要がある。本研究の結果は、医学腫瘍学コミュニティが新規治療薬の採用に際して、特定の疾患に関連した有効性エビデンスを必要とすることを示唆している。医学腫瘍学者、特に民間診療所の医師は、新しい高額な治療薬を CMS 払い戻し額より低い価格で購入できる場合、経済的インセンティブを持つ可能性がある。しかし、本研究でベバシズマブの急速または完全な採用が観察されなかったことは、医学腫瘍学者が Medicare 患者集団における不確実なベネフィットを持つ新規薬剤の使用に対して慎重で分別のあることを示唆している。また、Medicare のような公的医療保険制度における高額な薬剤の費用対効果を考慮する上でも、本研究の臨床的含意は極めて大きい。
残された課題:
今後の検討課題として、本研究におけるいくつかの limitation が挙げられる。第一に、SEER-Medicare データベースには、全身状態 (performance status) や呼吸機能、遺伝子変異 (EGFR や ALK など) といった重要な臨床情報が不足している。ただし、不良な肺機能や限定的な全身状態、ベバシズマブの臨床的禁忌 (重度の喀血、脳転移など) を有する患者を特定できないことは、実際にはベバシズマブ・カルボプラチン・パクリタキセル vs カルボプラチン・パクリタキセル間の生存優位性のギャップを拡大させるはずであり、本研究の知見の信頼性を高める。第二に、本研究は2002年から2007年に診断された患者を対象としており、より新しい治療法 (免疫チェックポイント阻害薬や分子標的薬など) が導入された現代の臨床現場におけるベバシズマブの役割については、今後の研究によるさらなる検証が必要である。第三に、本研究は Medicare fee-for-service 受給者に限定されており、全米の非扁平上皮NSCLC患者全体を代表しない可能性がある。ただし、臨床試験参加者のサンプルよりは実臨床をより代表していると考えられる。第四に、第2・3次化学療法の群間差が生存転帰に寄与した可能性があり、より多くの後続化学療法を受けた群が生存優位性を示す可能性がある。
結論:
本研究の解析は、ベバシズマブをカルボプラチン・パクリタキセル化学療法に追加することが、Medicare 患者の進行NSCLC における全体生存期間の改善と関連していないことを示唆している。将来的には、肺がんのように高齢患者に不均衡に影響を与える悪性腫瘍、または CMS が治療費の大部分をカバーする疾患については、臨床試験の主要スポンサーとの交渉により、高齢患者の適切な代表性および/または Medicare 患者に関連した事前計画されたサブグループ解析を義務付けることが望ましい。このような情報がない場合、臨床医は有効性研究からのサブグループ解析、本報告のような観察データ、および臨床判断に頼る必要がある。有効性研究からのサブグループ解析および観察データ解析の両者がベバシズマブを標準カルボプラチン・パクリタキセル療法に追加することのベネフィットを同定していないため、ベバシズマブはこの文脈では標準治療と考えるべきではない。臨床医は治療推奨を行う際に慎重であるべきであり、高齢患者に対してベバシズマブを分別のある形で使用すべきである。
方法
本研究は、SEER-Medicare データベースを用いた後ろ向きコホート研究である。対象は、2002年から2007年の間に病理学的に進行非扁平上皮NSCLC (AJCC 第6版における IIIB 期またはIV期) と診断された65歳以上の患者であり、診断から4ヶ月以内に1次治療としてBCP療法またはCP療法を開始した症例とした。他の一次がんの既往がある患者、診断後30日以内に死亡した患者、HMO (Health Maintenance Organization) 加入者などは除外された。Medicare パートA・B に継続的に加入していない患者も除外された。
コホートは、診断年と治療内容に基づき以下の3群に分類された。(1) 2006-2007年診断のBCP治療群 (n=318)、(2) 2006-2007年診断のCP治療群 (n=1,182)、(3) ベバシズマブ承認前の2002-2005年診断のCP治療群 (n=2,664)。ベバシズマブ承認前のコホートを対照として用いることで、医師が健康な患者にベバシズマブを選択する傾向に基づく選択バイアスを軽減した。
主要評価項目は、化学療法開始日から死亡日 (または2009年12月31日の打ち切り日) までの全体生存期間 (OS) とした。統計解析では、Kaplan-Meier 法を用いて生存曲線をプロットし、ログランク検定で群間比較を行った。また、交絡因子を調整するため、多変量コックス比例ハザード回帰モデルを構築した。
傾向スコア解析を実施し、治療選択バイアスを補正した。傾向スコアは、年齢、性別、人種/民族、婚姻状態、地理的地域、都市部居住、腫瘍分化度、国勢調査地域の教育水準、中央値所得、修正 Charlson 合併症スコア (Deyo adaptation)、AJCC 病期などの背景因子からロジスティック回帰を用いて算出した。各患者に推定傾向スコア (観察された背景特性に基づくベバシズマブ投与の予測確率) を割り当てた。傾向スコア層別化 (5分位)、傾向スコア回帰調整、1:1傾向スコアマッチング、および安定化逆確率治療重み付け (IPTW: inverse probability of treatment weighting) の4種類の手法を適用した。
患者背景の測定には、SEER から年齢、性別、人種/民族、婚姻状態、地理的地域、都市部居住、生態学的代理指標としての教育水準と中央値所得、合併症、AJCC 病期、腫瘍分化度を取得した。合併症の測定には、診断前13ヶ月から1ヶ月までの12ヶ月間の Medicare 入院、外来、医師請求データに対して Deyo adaptation of Charlson comorbidity index を適用し、肺がん特異的重み付けを用いた。合併症スコアは0、1、≥2の3群に分類した。
感度解析として、不死時間バイアスの影響を評価するため、カルボプラチン・パクリタキセル治療開始後8日以上生存した患者のみを対象とした解析を実施した。また、ベバシズマブ併用の定義を8日から30日に拡大し、生存測定を31日目から開始する別の解析も行った。統計ソフトウェアは SAS software version 9.2 を使用し、統計的有意性は p<0.05 (両側検定) とした。