- 著者: Peter Goldstraw, John Crowley, Kari Chansky, Dorothy J. Giroux, Patti A. Groome, Ramon Rami-Porta, Pieter E. Postmus, Valerie Rusch, Leslie Sobin (IASLC International Staging Committee)
- Corresponding author: Peter Goldstraw (Royal Brompton Hospital, London, UK)
- 雑誌: Journal of Thoracic Oncology
- 発行年: 2007
- Epub日: N/A
- Article種別: Original Article
- PMID: 17762336
背景
TNM悪性腫瘍分類は固形癌の病期評価における世界的な国際標準であり、治療方針の決定、予後予測、および臨床試験の層別化において極めて重要な役割を果たしている。しかし、肺癌のTNM分類第6版 (2002年) は第5版 (1997年) から変更がなく、その第5版自体は1975年以降に主に単一施設かつ外科手術症例から集積された5,319例という極めて小規模なデータベースに基づいていた。この間に胸部CTの普及、内視鏡技術の進歩、PET (positron emission tomography) の導入など、診断および病期診断技術の精緻化が世界的に進み、腫瘍径や転移部位の精密な評価が可能となった。
複数の独立したデータベースを用いた先行研究から、第5版および第6版の記述子や病期グループが実際の患者予後と乖離しているという指摘が相次いでいた。例えば、T2 (>3〜7cm) は予後的に均一でなく、悪性胸水は転移性病態に近い挙動を示すにもかかわらずT/M記述子において適切に分類されていないなど、内的一貫性の問題が指摘されていた。これらの問題は、既存の分類システムが現代の診断技術と臨床的理解に十分に対応できていないことを示しており、より大規模で多様なデータに基づく改訂の必要性が強く認識されていた。
これまでのTNM分類の改訂は、限られたデータと専門家の意見に基づいて行われることが多く、世界規模での検証や厳密な統計的検証が不足している点が課題として残されていた。IASLC (International Association for the Study of Lung Cancer) は1998年に肺癌病期分類プロジェクトを設立し、Cancer Research and Biostatistics (CRAB) をバイオスタティスティクスパートナーとして、過去最大規模の国際多施設データベースに基づく第7版改訂提案の作成に取り組んだ。
T記述子、N記述子、M記述子に関する各提案は同年のJTO別論文として先行報告されており、例えばT記述子についてはRami-Porta et al. (2007) が、M記述子についてはPostmus et al. (2007) が、N記述子についてはRusch et al. JThoracOncol 2007がそれぞれ詳細な分析結果を報告している。本論文は、これらの記述子改訂提案を踏まえ、それらを統合した病期グループ (Stage I〜IV) の新たな提案を提示するものである。これまでのTNM分類の改訂は、限られたデータと専門家の意見に基づいて行われることが多く、厳密な統計的検証が不足している点が課題として残されていた。本プロジェクトは、この知識ギャップを埋めることを目的としている。
このように、従来の分類システムには世界的な予後層別化能の検証が不足しているという明確な「不足」があり、特に多様な治療モダリティを反映した大規模コホートにおける各記述子の予後的妥当性は「未解明」のままであった。この歴史的な「課題が残されている」状況を打破するため、本研究では国際的な多施設共同レジストリを用いて、これまでの臨床研究における最大の「knowledge gap」を解消することを目指した。
目的
IASLC国際データベース (1990〜2000年診断、NSCLC 67,725例) に基づき、新たに提案されたT/M記述子定義を反映した第7版TNM病期グループを統計的に開発・検証し、第6版からの変更を提案すること。具体的には、既存の第6版TNM分類における病期グループ間の予後予測能力の不均一性や、一部の記述子 (例: 腫瘍径、悪性胸水) の臨床的意義との乖離を是正し、より精緻で予後層別化能力の高い病期分類システムを構築することを目指した。本研究の最終的な目的は、臨床的有用性と統計的妥当性を兼ね備えた、肺癌の国際的な標準病期分類の改訂案を提示することである。この改訂案は、治療選択の最適化、臨床試験の適切な層別化、および国際的な予後予測の一貫性向上に貢献することが期待される。
結果
新T/M記述子定義の導入: T記述子については、腫瘍径に基づく追加のカットオフが提案された。具体的には、T1a (≤2cm)、T1b (>2〜3cm)、T2a (>3〜5cm)、T2b (>5〜7cm) と細分化され、腫瘍径が7cmを超える場合はT3記述子に分類されることになった。肺内追加結節については、同葉内に追加結節がある場合はT4からT3へ降格され、同側他葉に追加結節がある場合はM1からT4へ降格された。M記述子については、悪性胸水、胸膜播種、心嚢内病変が新たにM1aとして定義された。M1カテゴリーはさらにM1a (胸膜内病変、対側肺結節) とM1b (遠隔転移) に細分化された。N記述子については、既存の分類から変更は提案されなかった (Table 3)。
RPAツリーによる生存層別化とハザード比: RPAアルゴリズムにより生成された生存ツリーの末端ノードは、TNMサブセットごとの予後を明確に層別化した (Figure 1)。最も予後良好なグループはT1a N0 (n=1,373) であり、ハザード比 (HR) は基準値の1.00であった。これに対し、T1b N0 (n=1,257) はHR 1.28、T2a N0 (n=2,346) はHR 1.80、T2b N0 (n=673) はHR 2.44と、腫瘍径の増大に伴いHRが段階的に上昇した。N1病変を有するT1〜T2b N1 (n=1,460) はHR 2.72を示し、T2b N0よりも予後不良であった。T3 N0 (n=2,466) はHR 3.67であり、N2病変を有するT1〜2a N2 (n=1,253) と同等の予後を示した。最も予後不良なグループはM1b N2-3 (n=1,287) であり、HR 16.44であった。M1a N0-1 (n=301) はHR 7.39、M1a N2 (n=212) はHR 9.97であり、M1bと比較して予後が良好であったものの、T4 N2 (n=239) と同等のHR 7.39を示すなど、進行期としての位置づけが確認された (Table 2)。
第6版からの主要な病期グループ変更: 複数のTNMサブセットが、提案された第7版では異なる病期グループに移行した (Table 4)。 (1) T2b N0 M0: 第6版のStage IBからStage IIAへ移行した。これは、T2b (>5〜7cm) の腫瘍がT2a N1と同等の予後を示すことが示されたためである。 (2) T2a N1 M0: 第6版のStage IIBからStage IIAへ移行した。これにより、T2a N1とT2b N1の予後が分離され、より適切な層別化が図られた。 (3) T4 N0-1 M0: 第6版のStage IIIBからStage IIIAへ移行した。これは、T4 N0-1の予後がT3 N2 (HR 6.69) よりも良好である (HR 5.47) ことが示されたためである。 (4) 悪性胸水・胸膜播種例: 第6版ではT4としてStage IIIBに分類されていたが、M1aとして再定義されたことにより、Stage IVへ移行した。これは、これらの病態が遠隔転移に近い予後を示すことを反映している。 また、同葉内追加結節 (旧T4) はT3に降格され、N0であればStage IIB、N1-2であればStage IIIAへ移行した。同側他葉追加結節 (旧M1) はT4に降格され、N0-1であればStage IIIA、N2-3であればStage IIIBへ移行した。
臨床病期における5年生存率の推移: 提案された第7版の臨床病期分類に基づく5年生存率は、病期が進行するにつれて段階的に低下した (Figure 2B)。Stage IA (T1a/b N0) は5年生存率50%以上 (中央値生存期間60ヶ月) と最も良好な予後を示した。Stage IB (T2a N0) は5年生存率40% (中央値37ヶ月) であった。Stage IIAは5年生存率36% (中央値14ヶ月) であり、Stage IIBは5年生存率25〜26% (中央値10ヶ月) であった。Stage IIIAは5年生存率19% (中央値18ヶ月) であり、Stage IIIBは5年生存率8%とさらに低下した。最も進行したStage IV (M1a/b) は5年生存率2% (中央値6ヶ月以下) と極めて不良な予後であった。これらの結果は、提案された病期分類が予後を良好に層別化していることを示している。
検証セットによる統計的妥当性の検証: 検証セット (n=9,133) での生存曲線は、トレーニングセットとほぼ同等であり、提案された病期分類の安定性を示した。病理病期データを用いたCox比例ハザード回帰分析では、隣接する全てのステージグループ間でハザード比が統計的に有意であった (Table 7)。例えば、病理病期におけるStage IB vs IAのハザード比は HR 1.55 (95% CI 1.41-1.70, p<0.0001) であり、Stage IIA vs IBのハザード比は HR 1.44 (95% CI 1.32-1.57, p<0.0001) であった。臨床病期モデルでは、Stage IIB vs IIAのハザード比は HR 1.46 (95% CI 1.25-1.70, p<0.0001) であり、Stage IIIA vs IIBは HR 1.27 (95% CI 1.15-1.40, p<0.0001) であった (Table 6)。臨床病期および病理病期モデルの両方において、提案された新システムは第6版と比較して分散説明率 (R^2) が向上した。臨床病期モデルではR^2値が25.86%から26.77%へ、病理病期モデルでは29.44%から30.40%へそれぞれ増加した。これは、新システムが予後予測においてより多くの分散を説明できることを意味する。
考察/結論
先行研究との違い: 本研究は、主に専門家の意見や単一施設の小規模データに依拠していた従来のTNM分類改訂プロセスと異なり、19ヶ国46施設から収集された67,725例という過去最大規模の国際多施設データベースに基づき、厳密な統計的手法を用いて客観的なエビデンスを構築した。特に、腫瘍径の連続的な予後因子としての重要性を定量的に示し、T1/T2の細分化や悪性胸水のM1aへの再分類など、予後との整合性を大幅に改善した。
新規性: 本研究で初めて、腫瘍径の追加カットオフ (T1a, T1b, T2a, T2b) を導入し、同葉内追加結節をT3へ、同側他葉追加結節をT4へ再分類する提案を行った。また、悪性胸水・胸膜播種・心嚢内病変をM1aとして定義し、M1をM1aとM1bに細分化したことは新規性がある。これらの変更は、RPAアルゴリズムによるデータ駆動型のアプローチと専門家合意の組み合わせにより導き出されたものであり、従来の分類では十分に反映されていなかった予後因子を適切に組み込んだ点で画期的である。
臨床応用: 主要変更点の臨床的意義は極めて大きい。腫瘍径による細分化に伴い、T2b N0 M0症例がStage IBからIIAへ移行したことで、完全切除後の補助化学療法の適応について再評価が必要となる。Winton et al. NEnglJMed 2005やDouillard et al. LancetOncol 2006の研究が示すように、N1陽性症例や進行期において術後補助化学療法のベネフィットが示されているため、この変更は臨床現場での治療アルゴリズムに大きな影響を与える。また、悪性胸水・胸膜播種のM1a再定義 (IIIBからIVへ) は、これらが遠隔転移に近い予後を示すという臨床観察を反映したものであり、手術非適応での全身化学療法選択に整合した変更となった。さらに、T4 N0-1のIIIAへの格上げは、同病変が切除可能例も含まれることを認識し、切除を目標とした集学的治療の対象として位置づけることを可能にした。
残された課題: 本プロジェクトにはいくつかのlimitationが存在する。第一に、臨床病期と病理病期の差異が依然大きく、臨床病期ではIAの正確度が低いという課題が残されている。第二に、後方互換性が一部失われ、既存データベースとの比較に支障が生じる可能性がある。第三に、解析対象が1990〜2000年診断例であり、その後普及したPET/CT、EBUS (endobronchial ultrasound) などの精緻な病期分類技術の影響は含まれていない。今後の検討課題として、これらの新しい診断モダリティを組み込んだデータベースの構築と分析が求められる。また、本データベースはアフリカ、南米、インド亜大陸からのデータが不足しており、地理的分布の偏りも今後の検討課題である。
方法
データ収集と対象患者: 本研究は、1990年から2000年の間に診断された肺癌症例を対象とした国際多施設共同研究であり、世界19ヶ国以上の46施設からデータが提供された。総計100,869例のデータがデータセンターであるCRAB (Cancer Research and Biostatistics) に提出された。除外基準 (研究期間外の症例、細胞型不明、診断時の情報不足、病期・治療・追跡情報が不十分な症例) を適用した後、81,015例が分析対象として残された。このうち、非小細胞肺癌 (NSCLC) は67,725例、小細胞肺癌 (SCLC) は13,290例であった。本研究では、T、N、M記述子の分析およびその後のTNMサブセットと病期グループの分析にはNSCLC症例のみが含まれた。治療モダリティは外科手術、放射線療法、化学療法、多モダリティ治療を含む全ての治療法が対象とされた。生存期間は、臨床病期データでは登録日 (レジストリでは診断日、プロトコルでは登録日) から、病理病期データでは手術日から測定され、カプラン・マイヤー法 (Kaplan-Meier method) により算出された。
病期グループ開発: 新たに提案されたT/M記述子 (0/1の二値変数として符号化) およびN stage (順序変数、NX除く) に基づき、RPA (recursive partitioning and amalgamation) アルゴリズムを搭載した統計ソフトウェア S-PLUS (Version 7.0) を適用して生存分割ツリーを構築した。分析は「best stage」に基づき、病理病期が利用可能な場合は病理病期、そうでなければ臨床病期が採用された。トレーニングセットは、新提案T/M記述子に変換可能な症例の2/3 (n=17,726) で構成され、候補病期グループの開発に用いられた。残りの1/3 (n=9,133) は検証セットとして確保された。ランダム割付は、データ提出種別と診断年代 (1990〜1995年 vs 1995〜2000年) で層別化された。RPA分析では、ログランク検定 (log-rank test) 統計量を用いて分割が行われ、ブートストラップ再サンプリングにより重要なグループ分けが選択された。RPA後、臨床実用性と統計的特性のバランスを考慮して専門家合意により最終病期グループが選定された。コックス比例ハザード回帰 (Cox proportional hazards regression) 分析として、SAS (Version 9.0) の PHREG (proportional hazards regression) 手続きを用いて、組織型、性別、地域、年齢 (60歳未満 vs 60歳以上) を調整して病期グループのハザード比 (HR) を算定した。新旧システムの比較には、予測モデルの分散説明率であるR^2値が用いられた。
内的検証: 開発された提案は、検証セット (n=9,133) に対して内部的に検証された。生存曲線がトレーニングセットと類似しているかを確認し、隣接病期グループ間のハザード比がCox回帰で有意であるかを評価した (組織型、性別、年齢、地域調整)。なお、本研究はレトロスペクティブな多国籍コホート研究 (retrospective cohort study) であり、特定の臨床試験登録番号 (NCT番号など) は持たないが、UICC (Union for International Cancer Control) および AJCC (American Joint Committee on Cancer) の承認を得た国際共同 Staging Project として実施された。主要評価項目 (primary endpoint) は全生存期間 (overall survival) とされた。