The IASLC Lung Cancer Staging Project: External Validation of the Revision of the TNM Stage Groupings in the Eighth Edition of the TNM Classification of Lung Cancer

著者: Kari Chansky, Frank C. Detterbeck, Andrew G. Nicholson, Valerie W. Rusch, Eric Vallières, Patti Groome, et al. (IASLC Staging and Prognostic Factors Committee)
Corresponding author: Kari Chansky (Cancer Research And Biostatistics, Seattle, Washington)
雑誌: Journal of Thoracic Oncology
発行年: 2017
Epub日: 2017-04-28
Article種別: Original Article
PMID: 28461257

背景

肺癌のTNM (tumor, node, metastasis 分類、腫瘍・リンパ節・遠隔転移の3軸で病期を定義する国際分類) はIASLC (International Association for the Study of Lung Cancer) の主導により国際データベースに基づく科学的根拠で改訂が重ねられてきた。先行研究1: Goldstraw 2007 (第7版提案、AJCC (American Joint Committee on Cancer) 2009年発効) は67,725例のIASLCデータベースから提案。先行研究2: 著者Rami Porta (IASLC Staging and Prognostic Factors Committee chair) 2014 (J Thorac Oncol) は1999〜2010年診断のn=94,708 patients (46施設・19カ国) からなる新データベースを公表。先行研究3: Asamura 2016 (N記述子は変更なしを提案)、Rami Porta 2015 (T記述子1 cm刻みの細分化)、Eberhardt 2015 (M1b (single extrathoracic metastasis) を単発・M1c (multiple extrathoracic metastases) を多発遠隔転移と細分化)、Goldstraw 2016 (TNM stage grouping統合) の第8版提案論文群が一連の改訂を提示した。先行研究4: Detterbeck 2016 が方法論および内部検証を公表。既存知見の課題: 第8版改訂提案は単一データベース (IASLC国際データベース) に依存しており、データベース構成自体に外科症例88%という選抜偏倚と地理的偏倚 (アジア施設の過剰代表) が含まれることから、独立外部データベースでの妥当性は未確立かつ未解明であった。本来必須とされる独立外部データベースでの検証が不足していた。特に北米コホートおよび非外科治療優位のコホートでの予後弁別能は未開拓で、これが何が足りなかったかの核心であった。先行のSEER (Surveillance, Epidemiology, and End Results) registryによる第7版外部検証実績はあったが、第8版に必要な詳細T記述子情報がSEERのExtent of Disease符号系では2010年まで一貫していなかったため使用不能であった。本論文はこのgap in knowledgeを埋めるべく、米国NCDB (National Cancer Data Base) という独立した大規模データベースでの外部検証を試みる。

目的

National Cancer Data Base (NCDB、米国外科医師会Cancer Commission運営の病院ベース大規模登録) のNSCLC・SCLC症例を用いて、IASLC第8版TNM病期分類の予後弁別能 (各stage groupおよびT・N成分の段階的生存分離能力) がIASLCデータベース外でも維持されることを独立検証し、第8版分類の地理的transportability (北米コホート) と非外科治療優位コホートへの適用可能性を実証することを目的とした。

結果

データベース特性とコホート構成の対照：NCDBとIASLCデータベースは規模および構成が大きく異なる (Table 1)。NCDB NSCLCの追跡期間中央値は40ヶ月、IASLCは63ヶ月。外科症例比率はNCDB 25%に対しIASLC 88%、男性比率はNCDB 54% vs. IASLC 63%、腺癌比率 (NOS (not otherwise specified) 除外後) はNCDB 50% vs. IASLC 61%。腺癌比率の差はIASLCデータベースにアジア施設が多く含まれることに起因する (Suppl Fig. 2)。NCDBのNSCLC治療内訳は無治療28%、化学療法のみ25%、手術のみ16%、手術+化学・放射線併用22%、放射線療法のみ8%、不明2%であり、北米における実臨床treatment landscapeを反映する (Fig. 1A)。一方IASLCは外科症例が88%を占め、寄与施設の専門性偏倚が明らかであった。本対照は外部検証の意義そのものを裏付ける—IASLC原データの「外科治療偏倚」「アジア施設偏倚」を補完する独立コホートでの検証が必要であったことを示す。

NSCLC臨床病期での隣接stage間予後弁別：NCDB clinically staged cohort (約61万例; n=612534 patients) で第8版stage IA1の中央生存は37.5ヶ月、stage IVは4.8ヶ月であった (Fig. 2A、Table 2)。隣接stage間の調整HR (年齢・性・組織型) は、IA2 vs. IA1: HR 1.04 (p=0.3208、有意差なし)、IA3 vs. IA2: HR 1.18 (p<0.0001)、IB vs. IA3: HR 1.21 (p<0.0001)、IIA vs. IB: HR 1.13 (p<0.0001)、IIB vs. IIA: HR 1.03 (p=0.0703、有意差なし)、IIIA vs. IIB: HR 1.21 (p<0.0001)、IIIB vs. IIIA: HR 1.23 (p<0.0001)、IIIC vs. IIIB: HR 1.15 (p<0.0001)、IV vs. IIIC: HR 1.54 (p<0.0001)。IA1/IA2およびIIA/IIBの2ペアでは有意差が消失し、これは対応するT記述子 (T1a/T1bおよびT3/T2b) で同様の重複として認められた (Suppl Fig. 3A)。臨床CT測定値の不精確さ (radiographic measurement variability) がこの重複の主因と考えられる。臨床病期モデルのR2は15.9%であり、IASLCの68.0%と比して低い—これは非外科治療や治療強度の不均一性が予後ばらつきに大きく寄与するためである。

NSCLC病理病期での完全な段階的弁別：病理病期コホート (約18万例; n=182616 patients) では臨床病期で見られた重複が解消し、stage IからIIICまでの全隣接stage間でp<0.0001の有意差が確認された (Fig. 2B、Table 2)。具体的HRはIA2 vs. IA1: 1.13、IA3 vs. IA2: 1.15、IB vs. IA3: 1.16、IIA vs. IB: 1.11、IIB vs. IIA: 1.33、IIIA vs. IIB: 1.32、IIIB vs. IIIA: 1.55、IIIC vs. IIIB: 1.47 (全てp<0.0001)。ただしIV vs. IIIC: HR 1.01 (p=0.8837) で病理stage IVと病理stage IIICの間に有意差なし—これは病理stage IV症例の症例数が限定的かつ既に転移性疾患として手術適応外であるため病理学的に検出された症例が選抜的であることを反映する。病理病期モデルのR2は31.2%であった。本知見は第8版T記述子細分化 (1 cm刻みのT1サブ分類) が病理計測条件下では生存差を正確に弁別することを実証する重要な所見である。

Best stage解析での全隣接stage有意差：約78万例 (n=780294 patients) のbest stage (病理優先) 解析では全隣接stage間で有意差を確認 (全p<0.0001) (Fig. 3、Table 3)。中央生存はstage IA1で103ヶ月、stage IVで4.9ヶ月。5年生存率はstage I群で53-69%、stage IVで3% (IASLCでは6%)。隣接stage HRはIA2 vs. IA1: 1.12、IA3 vs. IA2: 1.19、IB vs. IA3: 1.17、IIA vs. IB: 1.16、IIB vs. IIA: 1.19、IIIA vs. IIB: 1.27、IIIB vs. IIIA: 1.17、IIIC vs. IIIB: 1.11、IV vs. IIIC: 1.55。Best stage解析のR2は43.2% (IASLC 62.8%) で、臨床病期単独より大幅に改善—これは病理情報を組み合わせた実用的staging方針の妥当性を示す。

SCLC病期分類の外部検証：SCLC 約16万例 (n=157910 patients) の解析では臨床病期stage III-IVで第8版TNM分類が機能 (Fig. 4A、Table 4)。隣接HRはIIIA vs. IIB: HR 1.35 (p<0.0001)、IIIB vs. IIIA: HR 1.20 (p<0.0001)、IIIC vs. IIIB: HR 1.10 (p<0.0001)、IV vs. IIIC: HR 1.76 (p<0.0001)。一方stage I-IIでは大規模症例 (155,293例) にもかかわらず隣接stage間に有意差が得られず、SCLCの早期病期分類の予後弁別能には依然課題があることが明らかとなった (例：IA3 vs. IA2 HR 1.08 p=0.1933、IB vs. IA3 HR 1.08 p=0.1488)。病理病期SCLC 3,611例ではAsamura et al. JThoracOncol 2015が報告したIASLC原データ (582例) では症例数不足で検証できなかったstage IIIA以降の弁別が初めて確認された (IIIA vs. IIB HR 1.20 p=0.0169)。

IASLC・NCDB統合解析でのデータベース起源効果：両データベース統合Cox回帰 (stage、組織型、年齢、性、外科切除有無で調整) ではIASLCデータセットがNCDBに対して有意に良好な生存を示した (HR 1.22 [NCDBに不利方向]、p<0.0001)。データベース×stage交互作用項も全て有意 (p<0.0001) で、各stageごとの基準 (stage IA1) からの離れ方がNCDBでは IASLCより小さいパターンが確認された。これは両データベースの構成差 (外科症例比率、地域・施設特性、treatment access) に起因し、TNM分類自体の弁別能の問題ではないと著者は結論。むしろ「異なる集団・治療条件下でも分類の段階的弁別が一貫している」事実が第8版の堅牢性を示す。

考察/結論

本外部検証研究は、IASLC国際データベースから提案された第8版TNM分類の予後弁別能が、規模・構成・地理がまったく異なる北米中心NCDB (780,294例) でも一貫して維持されることを実証した。先行研究との違い：先行研究のDetterbeck 2016の内部検証論文はIASLCデータベース自体での内部交差検証に留まり、地理的・治療パターン的バイアスを排除できなかった点で本研究と本質的にと異なっている。本研究はIASLC原データとの重複が5%未満の独立コホートで第8版を検証した点で本質的な外部妥当性を示しており、これまでのSEER registryで実施された第7版外部検証の系譜とは異なり第8版独自の科学的基盤を確立する。さらに先行のRami-Porta 2015とは違って腫瘍計測条件 (CT臨床計測 vs. 病理計測) の差が隣接stage弁別能に与える影響を本研究で初めて定量化した。新規性：本研究で新たに示した novel な貢献として、(1) 北米中心の780,294例という前例のない規模での外部検証である点が新規であり、(2) 非外科治療コホート (NCDBは外科25%のみ) での弁別能確認が新規、(3) SCLC病理病期 (IASLC原データでは582例で症例数不足) の3,611例での初回検証もこれまでにないもので、(4) T1の1 cm刻み細分化が病理計測条件下では予後弁別を維持するが臨床計測条件下では一部消失することを示した点も新規である。臨床応用：第8版分類のUICC 2017年1月・AJCC 2018年1月発効の科学的根拠として直接利用可能であり、北米臨床現場での臨床判断・治療選択・臨床試験層別化に活用できる。特に病理病期での全隣接stage有意差は術後補助療法の適応決定や予後説明の信頼性を高める。臨床病期でのIA1/IA2・IIA/IIB重複は、より精度の高い画像計測 (high-resolution CT、PET-CTでの形状評価) や腫瘍直径以外のbiomarker (例：tumor SUVmax、循環腫瘍DNA) の補完的評価の必要性を示唆する。残課題と将来課題：(1) M記述子 (M1b/M1c) の外部検証がNCDBデータ構造の限界で実施できず、これは本論文最大の未解決事項であり今後の課題である。(2) NCDBはCommission on Cancer認証施設のみが寄与するため米国全土を網羅しない選抜バイアスがあり、将来的に全土カバレッジのデータベースでの追加検証が望まれる。(3) 横隔膜浸潤識別は「上位T3 descriptor」マスキング問題で完全には評価不能であり、descriptor収集方式の改良が今後必要。(4) SCLCの早期病期分類 (stage I-II) は症例数十分でも隣接stage有意差が得られず、SCLC生物学に特有の早期均一性を反映する可能性があり、今後TNM以外の予後因子 (LDH、performance status等) との統合が将来必要となる。本研究はFaivre-Finn 2024を含む後続の地域別検証研究の規範となり、IASLC第9版策定でも基盤データとして引用されている。

方法

本研究はNCDB (American College of Surgeons Commission on CancerとAmerican Cancer Society共同運営の病院ベースがん登録、データベース由来: NCDB Participant User File 2014 release) と IASLC国際データベース (1999〜2010年診断、n=94708 patients、IASLC International Staging Committee Cancer Research And Biostatistics Database、米国Seattle Washington管理) の2大データベースを並行解析した後ろ向きvalidation cohort研究である。NCDBから2000年1月〜2012年12月診断のinvasive NSCLC (non-small cell lung cancer) とSCLC (small cell lung cancer) 症例を抽出し、Commission on Cancer Collaborative Stage Data Collection System guidelinesに従って記録された第5〜7版のT・N・M descriptorsを第8版基準に再分類した。除外基準は (1) 解剖学的情報が不十分で第8版分類が不能な症例、(2) 第2原発癌、(3) ypTNM (neoadjuvant化学療法後病理病期、約2%)、(4) TNM descriptorsと記録stage間に矛盾がある症例。最終解析対象はNSCLCのbest stage (病理優先・なければ臨床) 解析n=780,294 patients (臨床病期n=612,534 patients、病理病期n=182,616 patients、重複n=14,857 patients)、SCLC n=157,910 patients (臨床病期n=155,293 patients、病理病期n=3,611 patients)。生存解析はKaplan-Meier法 + Cox proportional hazards regression (年齢>70歳、性、腺癌組織型を共変量として調整) で行い、IASLCデータでは投稿元データベース種別 (registry vs. other) で層別化、best stage解析では一次治療外科切除有無で層別化。隣接stage間のhazard ratio (HR) と p値を算出し、O’Quigley と Xu の方法による決定係数 (R-squared 統計量) で各モデルの説明力を評価。IASLC・NCDB統合データセットでデータベース起源 (NCDB vs. IASLC) を予測変数として投入したCox回帰でデータベース起源の独立予後寄与を検定。NSCLC・SCLCは別個に解析。注意点：NCDBでは単発 (M1b) vs. 多発 (M1c) 遠隔転移の区別が不可能なため、全M1症例をstage IVとして一括解析。横隔膜浸潤も「より上位の腫瘍descriptor」がある症例ではマスクされる構造的制約あり。全解析は統計解析ソフトウェア (SAS (Statistical Analysis System) version 9.4、SAS Institute、米国Cary, North Carolina) で実施。

Research Wiki

エクスプローラー

The IASLC Lung Cancer Staging Project: External Validation of the Revision of the TNM Stage Groupings in the Eighth Edition of the TNM Classification of Lung Cancer

背景

目的

結果

考察/結論

方法

グラフビュー

目次

バックリンク