• 著者: Sihan Li, Tianyu He, Jun Chen, Tingting Liu, Xinyu Zhao, Jun Dang(Sihan Li と Tianyu He は equal contribution)
  • Corresponding author: Jun Dang (Department of Radiation Oncology, The First Hospital of China Medical University, Shenyang, China); Xinyu Zhao (同左)
  • 雑誌: Frontiers in Immunology
  • 発行年: 2026
  • Epub日: 2026-06-03
  • Article種別: Systematic Review / Network Meta-Analysis
  • PMID: 42317330

背景

進行非小細胞肺癌(NSCLC, non-small cell lung cancer)に対する一次治療は、PD-1 / PD-L1 / CTLA-4 を標的とする免疫チェックポイント阻害薬(ICI, immune checkpoint inhibitor)の登場により大きく塗り替えられた。NSCLC は全肺癌の約 85% を占め、組織学的に扁平上皮癌(SQ-NSCLC)と非扁平上皮癌(non-SQ-NSCLC、大半が腺癌)に大別される。両者は分子プロファイルが大きく異なり、SQ-NSCLC では EGFR 変異や ALK 再構成といった標的可能なドライバー変異の頻度が著しく低く、標的療法の適用が限られる。長らく白金製剤を基盤とする化学療法が SQ-NSCLC の標準一次治療であったが、長期生存は不良なまま modest な benefit に留まっていた。

ICI を用いた一連の第 III 相無作為化比較試験(RCT, randomized controlled trial)は、単剤・併用いずれにおいても化学療法単独に対する優越性を一貫して示してきた。しかしその臨床的恩恵は組織型を超えて均一ではない。先行研究の代表例として、CHOICE-01 試験では toripalimab + 化学療法が non-SQ-NSCLC で全生存(OS, overall survival)を有意に改善(HR = 0.49, 95% CI: 0.35–0.69)した一方、SQ-NSCLC では benefit が得られなかった(HR = 1.09, 95% CI: 0.77–1.56)。逆に durvalumab を化学療法と比較した別の大規模第 III 相試験では、durvalumab が SQ-NSCLC で OS を改善(HR = 0.75, 95% CI: 0.58–0.98)したが non-SQ-NSCLC では有意差を認めなかった(HR = 0.91, 95% CI: 0.73–1.13)。さらに先行研究では、durvalumab ± tremelimumab を一次評価した RCT(Rizvi et al. JAMAOncol 2020)や cemiplimab + 化学療法の長期成績(Baramidze et al. JThoracOncol 2026)など個々のレジメンの組織型別データは蓄積されてきたが、いずれも単一試験の枠内に留まっていた。SQ-NSCLC と non-SQ-NSCLC は腫瘍変異負荷(TMB, tumor mutational burden)・免疫コンテクスチャ・腫瘍微小環境の組成が異なり、SQ-NSCLC は重度喫煙歴と併存症負荷を伴いやすいことも、ICI 反応性を修飾しうる先行研究の知見である。

しかし、ICI 同士の効果を SQ-NSCLC と non-SQ-NSCLC で直接比較した head-to-head RCT は存在せず、組織型が一次 ICI の生存恩恵に与える影響は定量的に特徴づけられていなかった。これが本研究の埋めるべき gap in knowledge であり、既存のネットワークメタ解析はいずれか一方の組織型のみを対象とし「同一レジメンの相対効果が組織型間で異なるか」を評価できていなかった点が未開拓のまま残されていた。すなわち先行研究には、両組織型を共通ネットワーク上で同時に比較し順位逆転を定量化する視点が不足しており、新規モダリティ(ivonescimab・benmelstobart)を含む最新エビデンスの統合も欠けていた。

目的

本研究の目的は、進行 SQ-NSCLC と non-SQ-NSCLC の患者を別々の解析集団とし、現在利用可能な一次 ICI ベースレジメンの比較効果を組織型特異的に定量評価することである。具体的には、第 III 相 RCT のみを統合し、(1) OS を主要評価項目、無増悪生存(PFS, progression-free survival)と Grade 3-5 治療関連有害事象(TRAE, treatment-related adverse event)を副次評価項目として、(2) ベイズ流ネットワークメタ解析により各レジメンを順位づけ(SUCRA (surface under the cumulative ranking curve)、累積順位曲線下面積で 1 が最良)、(3) PD-L1 発現レベル(< 1% / ≥ 1% / ≥ 50%)でサブグループ解析を行うことで、組織型ごとに最適なレジメン選択の臨床的根拠を提示する。最終的に「PD-L1 単独で治療選択を導けるか、組織型を意思決定に組み込むべきか」という臨床上の問いに答えることを狙いとした。

結果

toripalimab + 化学療法の OS 順位は組織型で完全に逆転する:non-SQ-NSCLC(30 試験・13,719 例・24 レジメン)では toripalimab + 化学療法が他の大半の ICI レジメンより有効で、HR は 0.42–0.65 の範囲、累積順位曲線下面積(SUCRA, surface under the cumulative ranking curve;1 が最良・0 が最劣)= 0.97 と最良にランクされた (Fig 3)。ところが SQ-NSCLC(28 試験・8,129 例・24 レジメン)では同レジメンが多くの ICI に劣り、比較薬対 toripalimab + 化学療法の HR は 0.47–0.65、SUCRA = 0.09 と最下位に転落し、代わって cemiplimab が最良(SUCRA = 0.92)であった。同一レジメンが組織型を変えるだけで首位と最下位を行き来するこの逆転が、本研究の中核所見である。

pembrolizumab + 化学療法は組織型間で効果の安定性に差がある:pembrolizumab + 化学療法は non-SQ-NSCLC で 7 つの他 ICI レジメンを上回り(HR 0.53–0.78)、SUCRA = 0.86 で 2 番手にランクされた (Fig 3)。一方 SQ-NSCLC では toripalimab + 化学療法を上回る(HR = 0.65, 95% CrI: 0.44–0.97)のみで SUCRA = 0.60 と中等度の順位に留まった。PFS では ivonescimab が SQ-NSCLC(24 試験・7,463 例、SUCRA = 0.97)・non-SQ-NSCLC(24 試験・9,454 例、SUCRA = 0.98)の双方で最良、benmelstobart + anlotinib も多くの比較薬を上回った (Fig 4)。これらの新規モダリティが両組織型で PFS 上位を占めた点は注目に値する。

PD-L1 < 1% サブグループでも組織型特異的差が persist する:SQ-NSCLC の PD-L1 < 1%(7 試験・1,047 例)では nivolumab + ipilimumab が atezolizumab + 化学療法より OS 良好(HR = 0.56, 95% CrI: 0.32–0.98)で、pembrolizumab + 化学療法に対しても改善傾向(HR = 0.59, 95% CrI: 0.33–1.05)を示し SUCRA = 0.83 で最良であった (Fig 5)。これに対し non-SQ-NSCLC の PD-L1 < 1%(14 試験・2,908 例)では逆に pembrolizumab + 化学療法が nivolumab + 化学療法・tislelizumab + 化学療法・cemiplimab + 化学療法を上回り(HR 0.36–0.60)SUCRA = 0.90 で最良、nivolumab + ipilimumab は SUCRA = 0.71 で 3 番手に留まった。

PD-L1 ≥ 50% でも順位の組織型逆転が再現される:PD-L1 ≥ 50% の SQ-NSCLC(11 試験・1,290 例)では penpulimab + 化学療法(SUCRA = 0.91)と atezolizumab + 化学療法(SUCRA = 0.74)が上位 2 レジメンで、cemiplimab + 化学療法が最劣(SUCRA = 0.36)であった一方、non-SQ-NSCLC(17 試験・2,818 例)では tislelizumab + 化学療法(SUCRA = 0.91)と cemiplimab + 化学療法(SUCRA = 0.88)が首位群となり、atezolizumab + 化学療法が最劣(SUCRA = 0.37)に転じた (Fig 5)。atezolizumab と cemiplimab の併用が、組織型を入れ替えると効果順位が文字どおり反転する点を示している。

PD-L1 ≥ 1% の OS でも組織型で最良レジメンが入れ替わる:PD-L1 ≥ 1%(PD-L1 ≥ 50% 限定試験は除外)の SQ-NSCLC(13 試験・2,867 例)では pembrolizumab・durvalumab の各単剤がいかなる併用レジメンに対しても非劣性で、penpulimab + 化学療法が最良(SUCRA = 0.89)であった (Fig 5)。これに対し non-SQ-NSCLC(19 試験・6,105 例)では cemiplimab + 化学療法・sintilimab + 化学療法が pembrolizumab・durvalumab・nivolumab の各単剤より OS 良好(HR 0.38–0.67)で、cemiplimab + 化学療法が最良(SUCRA = 0.96)に立った。SQ で単剤が非劣性となる一方 non-SQ では化学療法併用が優位という構図は、組織型ごとに「単剤で十分か併用が要るか」の判断が分かれることを示唆する。

PFS サブグループでも ivonescimab の優位が組織型横断で安定:PD-L1 < 1% の SQ-NSCLC(11 試験・1,931 例)では ivonescimab + 化学療法が pembrolizumab + 化学療法・atezolizumab + 化学療法・tislelizumab + 化学療法を上回り(HR 0.41–0.55)SUCRA = 0.93 で最良であったのに対し、同層の non-SQ-NSCLC(12 試験・2,507 例)では cemiplimab + 化学療法が 4 レジメンに劣り SUCRA = 0.07 で最劣、nivolumab + bevacizumab + 化学療法が首位(SUCRA = 0.82)に立った (Fig 5)。PD-L1 ≥ 1% の SQ-NSCLC(12 試験・2,222 例)でも ivonescimab + 化学療法が 6 つの他併用を上回り(HR 0.41–0.66)SUCRA = 0.93 と一貫して首位を維持した。PFS の組織型横断的安定性は OS の逆転とは対照的なパターンであり、エンドポイントによる順位の挙動差を示す。

安全性は ICI 単剤が一貫して低毒性:安全性解析には 38 試験・23,065 例が組み入れられ、nivolumab・atezolizumab・durvalumab・pembrolizumab・cemiplimab の各単剤は全 ICI 併用療法より有意に Grade 3-5 TRAE が低かった(OR 0.10–0.61)。SUCRA で最も低毒性なのは nivolumab(0.99)・atezolizumab(0.95)・durvalumab(0.94)の各単剤で、併用では durvalumab + tremelimumab(0.82)・toripalimab + 化学療法(0.70)・nivolumab + ipilimumab(0.68)が低毒性、逆に ipilimumab + 化学療法(0.11)・cemiplimab + 化学療法(0.13)・benmelstobart + 化学療法(0.14)が最も毒性が高かった (Supplementary Fig 1)。

統合された臨床特性とネットワークの整合性:最終的に組み入れられた 50 報・41 第 III 相 RCT のうち、9 試験が SQ-NSCLC 専用、9 試験が non-SQ-NSCLC 専用、23 試験が両組織型を組み入れてサブグループ別に OS / PFS を報告していた。34 試験が ICI(単剤または併用)を化学療法 ± bevacizumab と、7 試験が 2 つの ICI ベースレジメンを比較した。17 試験がアジア、24 試験が多国籍で、大半の患者は ECOG PS 0–1、EGFR / ALK 陰性であった。組み入れ 41 試験の追跡期間中央値は 25.2 ヶ月(IQR 15.1–38.0)であった (Table 1)。整合性評価では、consistency モデルが inconsistency モデルと同等の適合を示し global inconsistency は認めず、node-splitting でも直接・間接エビデンス間に有意な不一致はなかった。2 試験以上で informed された比較の異質性は概して低く(I² 範囲 0%–44%)、唯一の例外は non-SQ-NSCLC における pembrolizumab 対化学療法の OS(I² = 74%)で substantial heterogeneity を示した。ランダム効果モデルや mixed-histology 試験を除外した感度分析でも OS・PFS の順位に実質的変化はなかった。Risk of bias は 19 試験が low、1 試験が unclear、残る 23 試験は主に open-label デザインに起因する blinding 欠如で high と評価された。

考察/結論

本研究は、進行 NSCLC 一次治療における ICI レジメンの効果が組織型によって質的に異なることを、SQ-NSCLC と non-SQ-NSCLC を別々の解析集団として定量化した初めてのネットワークメタ解析である。最も象徴的な所見は toripalimab + 化学療法の順位逆転(non-SQ で SUCRA 0.97 =最良、SQ で 0.09 =最下位)であり、同様の逆転は atezolizumab + 化学療法(PD-L1 ≥ 50% で SQ 2 位 / non-SQ 最劣)や cemiplimab + 化学療法でも PD-L1 層別を超えて persist した。

先行研究との違い:従来のネットワークメタ解析(参考文献 71–77)はいずれも SQ-NSCLC か non-SQ-NSCLC の一方のみを評価し、組み入れ試験数も限られ、ivonescimab や benmelstobart といった新規薬を含まず、最新の長期生存データも未反映であった。これらと対照的に、本研究は両組織型を同時かつ並列に評価することで「相対効果が組織型間で異なるか」という、先行研究では構造上答えられなかった問いに直接答えた点が決定的に異なる。

新規性:本研究で初めて、両組織型に共通の治療ネットワークを構築して同一レジメンの SUCRA を組織型横断で対比し、二重 ICI と化学療法併用の優劣が組織型依存的に入れ替わることを明示した。機序的には、SQ-NSCLC は腫瘍浸潤リンパ球(TIL)が少なく好中球浸潤が多く T 細胞活性を抑制すること、喫煙歴・高 TMB により二重 ICI の恩恵を受けやすいこと(CheckMate 227 で PD-L1 < 1% かつ TMB ≥ 10 mut/Mb は HR = 0.51 と benefit 増大)が、抗 CTLA-4 併用が SQ で優位となる説明として提示された。non-SQ-NSCLC では KEAP1 / STK11 変異の高頻度が、化学療法併用より二重 ICI を選好すべき biomarker 候補として位置づけられた。

臨床応用・橋渡し:これらの所見は、PD-L1 status 単独では治療選択に不十分で、組織型を臨床意思決定に統合すべきという橋渡し的提言に直結する。具体的には non-SQ-NSCLC の低 PD-L1 では bevacizumab 併用(nivolumab + bevacizumab + 化学療法)が、SQ-NSCLC では ivonescimab や benmelstobart + anlotinib といった VEGF 標的併用が有望であり、PD-L1 高発現かつ PS 不良例では低毒性で非劣性の ICI 単剤(cemiplimab・pembrolizumab・ivonescimab)が代替肢となりうる。安全性順位(単剤 < 二重 ICI < ICI + 化学療法)と組み合わせた benefit–risk 評価が、個別化レジメン選択を支える枠組みとなる。

残された課題・今後の検討:本研究には限界があり、大半のレジメン比較が間接比較で、多くの直接比較が単一試験由来のため異質性を formal に評価できなかった。多くの試験が unselected NSCLC を組み入れ、組織型別データはサブグループ解析由来で transitivity を formal に検証できず、潜在的交絡により結果は慎重な解釈を要する。また ivonescimab・benmelstobart の試験は中国単独・短期追跡・OS 未成熟であり、global RCT での確認が今後の検討課題である。年齢・性別・喫煙状況・地域・PD-L1 アッセイ手法といった他の effect modifier もデータ制約で評価できなかった。将来の試験デザインは PD-L1 発現と病理型の双方を考慮し、より個別化されたアプローチへ精緻化することが望まれる。本領域の関連エビデンスとして、cemiplimab + 化学療法の長期成績は Baramidze et al. JThoracOncol 2026、nivolumab + ipilimumab + 化学療法の一次治療は Carbone et al. ESMOOpen 2025、durvalumab ± tremelimumab の一次治療は Rizvi et al. JAMAOncol 2020、pembrolizumab 単剤の基盤データは Garon et al. NEnglJMed 2015 が個別 RCT として相補的に参照できる。

方法

本メタ解析は PRISMA ガイドラインに準拠して実施された。2 名の著者(S.L. と T.H.)が独立に PubMed, Embase, the Cochrane Library, Web of Science, Scopus の 5 データベースを 2026 年 2 月 28 日までに発表された適格 RCT について系統的に検索し(詳細な検索式は Supplementary Table 1)、ASCO・ESMO・ELCC (European Lung Cancer Congress)・WCLC (World Conference on Lung Cancer) の最近の主要学会抄録も review した。包含基準は、(1) 進行 SQ-NSCLC または non-SQ-NSCLC を対象に一次 ICI ベースレジメン(単剤または併用)を化学療法または別の ICI ベースレジメンと比較した第 III 相試験で、(2) OS および/または PFS データ、および/または Grade 3-5 TRAE が利用可能なもの。NSCLC 患者を組み入れ組織型別に生存アウトカムを報告した試験も適格とし、同一試験の複数報告がある場合は最も追跡が長い最新報告を採用した。

データ抽出も 2 名が独立に行い、試験特性(試験名・地域・サンプルサイズ・追跡期間中央値・レジメン)、患者特性(年齢・性別・ECOG PS・喫煙歴・PD-L1 発現)、アウトカム(OS / PFS の HR と 95% CI、Grade 3-5 TRAE の OR と 95% CI)を収集した。バイアスリスクは Cochrane Risk of Bias Tool で評価した。統計解析は、Markov chain Monte Carlo (MCMC) シミュレーション法を用いたベイズ流ネットワークメタ解析を R software(version 4.3.2)の gemtc パッケージで実施した。各試験から抽出した OS / PFS の効果量は Cox regression(コックス回帰)由来の HR を用い、ベイズ流の事前分布を介して統合した。大半の直接比較が単一試験由来であったため、fixed-effects consistency model を適用した。各アウトカムで 4 本の独立 Markov 鎖を同時に走らせ、burn-in 10,000 回に続き 1 鎖あたり 150,000 回のサンプル反復(step size 10)で事後分布を得た。収束は trace plot と Brooks–Gelman–Rubin 診断で評価した。

各治療が最良または最低毒性である確率の順位づけには SUCRA(surface under the cumulative ranking curve、1 が最良・0 が最劣)を用いた。Global inconsistency は consistency / inconsistency モデルの DIC(deviance information criterion)比較で評価し、local inconsistency は pairwise と network 推定値の比較および node-splitting 法(両側 P < 0.05 で有意)で評価した。異質性は 2 試験以上で informed された比較について Q 検定と I² 検定で評価した。サブグループ解析は PD-L1 発現レベル別に行い、感度分析はランダム効果モデルの使用または mixed-histology 試験の除外により実施した。