• 著者: Scott J Adams, Emily Stone, David R Baldwin, Rozemarijn Vliegenthart, Pyng Lee, Florian J Fintelmann
  • Corresponding author: Scott J Adams (Department of Radiology, Massachusetts General Hospital, Harvard Medical School, Boston, MA, USA)
  • 雑誌: Lancet
  • 発行年: 2023
  • Epub日: 2022-12-20
  • Article種別: Review
  • PMID: 36563698

背景

肺がんは世界におけるがん関連死の首位を占める疾患であり、2020年の肺がん死亡数は約180万例に達する (Sung et al. CACancerJClin 2021)。肺がん死亡率の高さの根本原因は診断時の病期の遅さにあり、早期発見・早期治療を実現するスクリーニング戦略の確立が長年の優先課題とされてきた。1970年代の胸部X線・喀痰細胞診による初期スクリーニング試験は死亡率低下を示せず研究が停滞したが、1990年代に日本および北米で開始された低線量 CT (low-dose CT; LDCT) を用いたアプローチが状況を一変させた。ELCAP (Early Lung Cancer Action Project) はLDCTが胸部X線よりも小さな非石灰化結節の検出に優れることを実証し、これを端緒にNLST (National Lung Screening Trial) とNELSON試験という2つの大規模ランダム化比較試験が設計された (Thai et al. Lancet 2021)。両試験がLDCTによる肺がん死亡率低下を確立したことで、各国でのスクリーニングプログラム導入の科学的根拠は揃った。しかしながら、スクリーニング対象の最適な選定方法、非喫煙者への適用、肺結節管理の標準化、禁煙介入の統合方法、費用対効果の評価、AI (artificial intelligence; 人工知能) やバイオマーカーの役割、および国際的な実施における制度的・社会的障壁について、臨床的有効性と費用対効果を最大化するうえで不可欠な知識のギャップが残存していた。特に、アジア人非喫煙者における肺がん罹患率の高さを踏まえた喫煙歴に依存しない選定基準の開発、AI を活用した個別化スクリーニング間隔の実現、血液バイオマーカーによる偽陽性低減、および低・中所得国での実施可能性については手薄な状況にあり、最適なスクリーニング対象・間隔・バイオマーカー活用法は依然として未解明な点が多く、グローバルな実施に必要なエビデンスが著しく不足していた (Zhang et al. NatRevClinOncol 2026)。

目的

本レビューの目的は、LDCTによる肺がんスクリーニングに関する2000年1月から2022年4月までのエビデンスを統合し、(1) 主要臨床試験の概観、(2) スクリーニング適格者の選定とリスクモデルの比較評価、(3) 非喫煙者・がん生存者への適用、(4) スクリーニング発見所見 (肺結節・偶発的所見・COPD (chronic obstructive pulmonary disease)・心血管リスク) の管理、(5) 禁煙介入の有効性、(6) 費用対効果の国際比較、(7) 個別化スクリーニング間隔・AI・バイオマーカーという将来の方向性、(8) 国際的な実施上の課題と機会を包括的に論じることである。これにより、各国・地域の肺がんスクリーニングプログラムの設計と最適化に資するエビデンス基盤を提供し、今後の研究優先課題を示すことを目指す。

結果

主要ランダム化比較試験における肺がん死亡率低減効果: NLST は米国33施設で n=53,454 例 (55-74歳、30パック年以上、過去15年以内の喫煙歴あり) を登録し、2002-2004年に3年間の年1回LDCTと胸部X線撮影を比較した (Table 1)。LDCT 群では肺がん死亡率の20.0%相対減少 (95% CI 6.8-26.7, p=0.004) および全死亡率の6.7%減少 (95% CI 1.2-13.6, p=0.02) が示され、1人の肺がん死を予防するための要スクリーニング数 (NNS; number needed to screen) は 320 であった。NELSON 試験はオランダ・ベルギーで n=15,789 例 (男性 n=13,195、女性 n=2,594) を登録し、ベースライン・1年・3年・5.5年時点のLDCT (半自動体積測定を採用) と非スクリーニングを比較した (Table 1)。10年時点での肺がん死亡累積率は男性で24%低下 (cumulative RR 0.76, 95% CI 0.61-0.94, p=0.01)、女性では33%低下 (cumulative RR 0.67, 95% CI 0.38-1.14) となったが女性では統計的有意差は得られなかった。NELSON 試験では全死亡率には有意差がなく、この点はNLSTとは対照的であった。9試験 n=94,921 例を統合したメタ解析では、LDCTスクリーニングにより肺がん死亡率が16%相対減少 (relative rate 0.84, 95% CI 0.76-0.92) し、全死亡率も3%低減 (RR 0.97, 95% CI 0.94-1.00) した。中国 National Lung Cancer Screening Programme 前向きコホート (n=1,016,740 例) では、1回限りのLDCTが肺がん死亡率を31%低減 (HR 0.69, 95% CI 0.53-0.92)、全死亡率を32%低減 (HR 0.68, 95% CI 0.57-0.82) させた。MILD 試験 (n=4,099) では年次・隔年いずれのLDCTも非スクリーニングと比較して肺がん死亡率を39%低減し、ドイツ LUSI 試験では女性で69%低減 (男性では有意差なし) が示された。これらの結果は、LDCTスクリーニングが喫煙歴の高リスク集団において肺がん死亡率を20-39%低減するエビデンスを強固に支持する。

スクリーニング対象の選定: リスクモデルと適格基準の国際比較: NLST・NELSON はカテゴリカルな喫煙歴基準を採用したが、米国 USPSTF (United States Preventive Services Task Force) は2021年に対象を50-80歳・20パック年以上に拡大した (Table 2)。モデリング研究では拡大基準により肺がん死亡率低下が9.8%から13.0%へ改善され、非ヒスパニック系黒人の適格者割合が1.9%から3.9%へ107%増加し人種格差の一部解消が見込まれた。多変数リスクモデルとして PLCO m2012 (Prostate, Lung, Colorectal, and Ovarian cancer screening trial) モデル (年齢・人種・喫煙歴・個人がん歴・家族歴・COPD・学歴・BMI (body mass index) を統合) が特に評価されており、ILST (International Lung Screening Trial、n=5,819) の前向き解析では6年以内リスク ≥1.51% 閾値でUSPSTF 基準より優れた予測能を示した。英国では NHS (National Health Service) Targeted Lung Health Check Programme が PLCO m2012 リスク ≥1.51% または LLP (Liverpool Lung Project) 5年リスク ≥2.5% を適格基準として採用した (Table 2)。LLP v2 モデルは UKLS 試験で5年リスク ≥5% の閾値を用いて2.1%の肺がん検出率を達成した。9つのリスクモデルの比較では LCDRAT (Lung Cancer Death Risk Assessment Tool) と LCRAT (Lung Cancer Risk Assessment Tool) が最高識別能 (AUC 0.82 と 0.81) を示した。アジア人非喫煙者については台湾 TALENT 試験 (n=12,011、非喫煙高リスク者) でLDCT検出率2.6% (NLSTの1.1%を大きく上回る)、韓国コホート (n=28,807) で非喫煙者0.45% vs 喫煙者0.86%、日本コホート (n=12,114) で非喫煙者1.1% vs 喫煙者1.1%が示された。世界の肺がん患者の少なくとも25%は非喫煙者であり、特に南アジアでは女性肺がんの83%が非喫煙者に発生するため、アジア特化リスクモデルの開発が急務とされた (Zhang et al. NatRevClinOncol 2026)。がん生存者については、膀胱がん患者の10年累積二次がんリスクは19%でその25%が肺がんを占め、肺がん生存者では10年累積二次原発肺がんリスクの中央値が8.4%に達し、通常のスクリーニング適格基準を満たさない場合も含め10年間の定期画像サーベイランスが推奨された。

スクリーニング発見所見の管理: 結節・偶発的所見・COPD・心血管リスク: 肺結節の管理は Lung-RADS (Lung CT Screening Reporting and Data System) 2022 と BTS (British Thoracic Society) ガイドラインにより標準化された (Figure)。結節の悪性度予測の最重要因子はサイズと成長速度であり、手動径測定の誤差が1.5mmと大きいため半自動体積測定が推奨される。BTS では25%以上の体積変化を有意と定義しており、径5mmの結節では径が5.4mmへ増大することに相当する。充実型結節では PanCan/Brock 大学ツール (悪性確率 >10% で Herder モデル後PET-CT (positron emission tomography-CT) 評価) を用い、部分充実型結節 (part-solid nodule) は固形成分 ≥8mm でPET-CT考慮、純すりガラス結節 (pure ground glass opacity) は原則として経過観察から開始する。英国での BTS ガイドライン適用後、良性疾患への外科的切除率はNLSTの24%から4.6%へ改善された。偶発的所見 (incidental findings) はスクリーニング参加者の28-94%で確認され (大学病院67% vs 地域CT施設28%)、そのうち15%が精査を要した (Table 3)。Table 3 に整理された管理推奨には甲状腺結節 (≥15mm)・冠動脈石灰化・胸部大動脈瘤 (上行大動脈 ≥42mm)・線維性間質性肺疾患・骨粗鬆症 (L1椎体 <100 Hounsfield units) 等、多岐にわたる所見への対応が含まれる。COPD については参加者の24-63%で少なくとも軽度の気腫が検出され、気腫の存在・程度は肺がんリスクと独立した関連を示した (RR 1.3-3.6)。心血管疾患については、心血管疾患歴のない参加者の98%が高心血管リスク (≥10%の10年リスク) を有し、57%はスタチン療法の適応があったにもかかわらず未服用であった。冠動脈石灰化の視覚的評価または Agatston スコアによる定量化は心血管イベントの強力な予測因子であり、LDCTスクリーニングが肺がん以外の主要疾患の一次発見プラットフォームとしても機能することが示された。

AI・バイオマーカーによる効率化と費用対効果・国際実施状況: AI は放射線線量低減・結節検出・悪性度評価・個別化スクリーニング間隔にわたる活用が期待される。既存AIアルゴリズムの結節検出感度は83-97%、精度は82-98%に達し、一部は放射線科医の感度を超える (特に小結節)。偽陽性率は約1結節/スキャンまで低減されている。深層学習型ノイズ低減を超低線量CT (0.07 mSv または 0.14 mSv) に適用すると通常アルゴリズムと比較して結節検出率・測定精度が向上した。Sybil は単回LDCTから最大6年先の肺がんリスクを予測する外部検証済みの深層学習アルゴリズムである。バイオマーカーとして、MILD 試験サブコホートでは血漿 miRNA (micro ribonucleic acid) シグニチャ分類子が非石灰化結節 (>5mm) の偽陽性率を19.4%から3.7%へ低減した (Table 1)。COSMOS 試験 (n=1,000例超) での13-microRNA miR-test は肺がん診断の全体精度75% (95% CI 72-78) を示した。INTEGRAL コンソーシアムの4タンパク質血中バイオマーカーパネルは AUC 0.83 (喫煙歴単独 AUC 0.73 に対し有意に改善) を達成した。ECLS (Early Diagnosis of Lung Cancer Scotland) 試験 (n>12,000) では7自己抗体 EarlyCDT-Lung 陽性者にLDCT実施したところ2年後にstage III/IV 肺がんの割合が標準ケアより低下した。費用対効果については NLST に基づくICER (incremental cost-effectiveness ratio) は 81,000/QALY (quality-adjusted life year)、2021年USPSTF推奨では 26,000/QALY と一般人口の $44,000/QALY より顕著に低く、高疾患負担集団での費用対効果の優位性が確認された。禁煙介入については参加者の55-74%が参加を契機に禁煙意欲が高まったと報告し、禁煙率はスクリーニング試験全体で7-23%と幅があった。Georgetown のSCALE (Smoking Cessation within the Context of Lung Cancer Screening) 試験では集中介入 (電話8回+ニコチンパッチ8週間) vs 最小介入 (電話3回+パッチ2週間) で3ヵ月時点の生物学的確認禁煙率が9.1% vs 3.9%と有意差を示したが6・12ヵ月では有意差は認められなかった。実施上の課題として米国では2016年データでUSPSTF適格者の4%未満しかスクリーニングを受けておらず、2018年には17%超まで改善したが依然低く、英国 Lung Screen Uptake Trial では社会経済的不利地域での参加率53%達成にモバイルCTスキャナーや「lung health check」という呼称変更が有効であったことが示された。

考察/結論

本レビューは、LDCTスクリーニングが世界規模での実装段階に移行しつつある時期のエビデンス統合として重要な意義を持つ。NLSTとNELSON の大規模RCTが肺がん死亡率の20-24%低減という明確なベネフィットを確立したことは、これまでの研究における1970年代の胸部X線・喀痰細胞診スクリーニング試験の失敗とは対照的であり、LDCTスクリーニングの科学的妥当性が揺るぎなく示されている。既報の個別研究が各トピックを断片的に扱ってきたのとは異なり、本レビューは対象選定・結節管理・COPD/心血管の多目的評価・禁煙介入・費用対効果・AI・バイオマーカー・国際実施という全側面を統合した点が先行研究と大きく異なる。

本論文で新規の重要な視点として提示されたのは、LDCTスクリーニングが肺がん死亡率低減にとどまらず COPD・心血管疾患という喫煙関連疾患の一次発見プラットフォームとしても機能しうるという多目的活用の可能性である。心血管疾患歴のない参加者の98%が高心血管リスクを有し57%がスタチン未服用という事実は、novel な視点として、スクリーニング機会を活用した一次予防介入の重要性を示している。また Sybil のような単回LDCTから6年先の肺がんリスクを予測するAIアルゴリズムや、miRNA・タンパク質・自己抗体バイオマーカーによる偽陽性低減という新規な技術群が実装段階の課題解決の道筋として整理されている点も、従来のレビューにはなかった視座を提供する。

臨床応用の観点では、PLCO m2012 モデルによるリスクベース選定がカテゴリカル基準より精度が高く、USPSTF 2021年基準の50-80歳・20パック年への拡大がその実践例となっている。臨床的意義として特に重要なのは、非喫煙アジア人の肺がん検出率 (台湾 TALENT で2.6%、日本コホートで1.1%) が喫煙者と同程度に高いという事実であり、現行の喫煙歴依存型基準が全人口をカバーできないことを示す。禁煙介入の統合 (集中介入で3ヵ月禁煙率9.1% vs 最小介入3.9%)・偶発的所見管理プロトコルの整備・費用対効果の高疾患負担集団への適用最適化といった実装上の調整が、スクリーニングプログラムのベネフィットを最大化するための臨床現場での課題として論じられた。

残された課題として、個別化スクリーニング間隔を安全に実施するためのリスクモデルの前向き外部検証 (4-IN-THE-LUNG-RUN・SUMMIT 試験で進行中)、AIアルゴリズムの外部検証・商用化に向けた規制整備、アジア人集団向けリスクモデルの開発、および低・中所得国でのAI活用スクリーニングの実現可能性評価が挙げられる。今後の研究として、禁煙介入の最適な型・強度・メッセージ内容の標準化 (YESS・SCALE 研究群の結果待ち)、health equity 確保のための文化的配慮を組み込んだ地域密着型実施戦略の確立、および COPD・心血管リスク評価との統合スクリーニングモデルの費用対効果検証が重要な方向性として提示されている (Potter et al. AnnThoracSurg 2023)。さらに limitation として、現行のほとんどのスクリーニング試験が欧米または東アジア高所得国を対象としており、世界の喫煙者の80%が居住する低・中所得国におけるエビデンスが不足している点も今後の検討が必要な重大な課題として指摘されている。

方法

MEDLINE、Scopus、および Cochrane Library の3データベースを対象に、2000年1月1日から2022年4月30日の期間で系統的文献検索を実施した。言語制限は設けず、「lung cancer screening」および「lung screening」を基本検索語とし、「trial」「risk prediction」「risk models」「selection」「management」「guidelines」「follow-up」「incidental findings」「COPD」「cardiovascular risk」「smoking cessation」「tobacco cessation」「cost effectiveness」「screening interval」「artificial intelligence」「machine learning」「deep learning」「radiomics」「biomarkers」「implementation」との組み合わせ検索を行った。初期検索で特定された論文の参考文献リストからも追加論文を収集した。選択基準はランダム化比較試験 (NLST・NELSON・MILD (Multicentric Italian Lung Detection)・UKLS (UK Lung Cancer Screening)・LUSI (Lung Cancer Screening Intervention)・ITALUNG (Italian Lung Cancer CT Screening Trial)・DANTE (Detection And Screening of Early Lung Cancer with Novel Imaging Technology)・DLCST (Danish Lung Cancer Screening Trial) 等)、単群コホート研究 (ELCAP・I-ELCAP (International Early Lung Cancer Action Program)・TALENT (Taiwan Lung Cancer Screening in Never-Smoker Trial)・COSMOS (Continuous Observation of Smoking Subjects)・PanCan (Pan-Canadian Early Detection of Lung Cancer) 等)、系統的レビューとメタ解析、リスクモデル比較研究、コスト効果分析、AI/バイオマーカー研究、および各国ガイドライン文書とした。引用された個別研究では Cox 比例ハザードモデル (HR; hazard ratio 算出)、カプラン・マイヤー法 (累積生存・死亡曲線)、log-rank 検定 (群間生存率比較)、受信者動作特性曲線下面積 (AUC; Area Under the receiver operating Characteristic curve、リスクモデル識別能比較)、ランダム効果モデルによるメタ解析が用いられた。スクリーニング論文の同定は PubMed および Cochrane Library を通じて行われた。