- 著者: Jean-Paul Sculier, Kari Chansky, John J. Crowley, Jan Van Meerbeeck, Peter Goldstraw (on behalf of the International Staging Committee and Participating Institutions)
- Corresponding author: Jean-Paul Sculier (Institut Jules Bordet, Universite Libre de Bruxelles, Brussels, Belgium)
- 雑誌: Journal of Thoracic Oncology
- 発行年: 2008
- Epub日: N/A
- Article種別: Original Article
- PMID: 18448996
背景
IASLC (国際肺癌研究協会) は、TNM分類第7版改訂に向け、100,869例超の多国籍データベースを構築し、Tカテゴリ、Nカテゴリ、Mカテゴリ、およびステージグループの修正提案を行った。これらの提案は、生存予後判別能の改善を目的とするものであったが、臨床ステージ以外の予後因子(パフォーマンスステータス (PS)、年齢、性別、組織型、検査値など)がステージとどのように関連し、独立した予後因子として機能するかについての系統的解析が不足していた。従来の予後因子解析は、主にcooperative groupの臨床試験データベース(非小細胞肺癌 (NSCLC) で893-2,631例、小細胞肺癌 (SCLC) で614-2,580例)を用いた小規模研究に限られ、全ステージを網羅した大規模モデルは存在しなかった。例えば、Albain et al. JClinOncol 1991は進行NSCLCにおける生存決定因子を報告しているが、その規模は限定的であった。また、Hoang et al. JClinOncol 2005も同様に進行NSCLCの予後予測モデルを提示しているが、全ステージを対象としたものではない。SCLCにおいても、Paesmans et al. Cancer 2000は763例のSCLC患者における予後因子を分析しているが、これも大規模な国際データベースを用いたものではなかった。IASLCの予後因子サブ委員会はこの知識ギャップを埋めるべく、世界最大の肺癌予後因子解析を実施し、解剖学的進展度以外の予後因子の影響を詳細に評価する必要があった。特に、TNM第7版の提案が、これらの追加因子とどのように相互作用し、予後予測をさらに改善できるかという点が未解明であった。このような背景から、既存のTNM分類を補完し、より精度の高い予後予測を可能にするための新たなモデル構築が喫緊の課題として認識されていた。
目的
IASLC国際ステージングデータベースを用いて、NSCLCおよびSCLCにおける臨床ステージ(解剖学的進展)とは独立した有意な予後因子を同定し、これらの因子を組み込んだ予後予測モデルを構築することを目的とした。具体的には、PS、年齢、性別、組織型、および一部の検査値が、TNM分類第6版およびIASLC提案の第7版における病期分類とどのように関連し、独立した予後情報を提供するかを明らかにすることを目指した。本研究は、特に全ステージを対象とした大規模なコホートにおいて、これらの追加予後因子がTNMステージングの予測能力をどの程度補完し、臨床的有用性を持つかを評価することを意図した。
結果
NSCLCにおける全般特性の多変量解析: 12,426例のNSCLC患者を対象としたCox比例ハザード回帰分析の結果、IASLC提案による臨床ステージが最も強力な予後因子であることが示された。ステージIIはハザード比 (HR) 1.80 (95% CI 1.65-1.97, p<0.001)、ステージIIIAはHR 2.71 (95% CI 2.49-2.95, p<0.001)、ステージIIIB/IVはHR 5.34 (95% CI 4.95-5.76, p<0.001) であった。PSも独立した重要な予後因子であり、PS 1はHR 1.38 (95% CI 1.32-1.44, p<0.001)、PS 2はHR 2.09 (95% CI 1.95-2.23, p<0.001)、PS 3-4はHR 3.48 (95% CI 3.17-3.83, p<0.001) であった。さらに、年齢(連続変数、HR 1.01/年, p<0.001)および男性(HR 1.17, 95% CI 1.11-1.23, p<0.001)も独立した予後因子として確認された。非扁平上皮型は扁平上皮型と比較してHR 0.93 (95% CI 0.89-0.97, p<0.001) であり、扁平上皮型がわずかに予後良好であった。フルモデルのR2値は36.2%であり、ステージのみのモデルのR2値32.9%と比較して、予後因子の追加による改善は限定的であった (Table 2)。
NSCLC RPA解析による4群分類: NSCLC患者の学習セット8,199例および検証セット4,227例を用いたRPA (Recursive Partitioning and Amalgamation) 解析により、4つの異なる予後グループが識別された (Figure 1, Figure 2)。Group 1 (青) はIA-IIA期で年齢・PSを問わず、中央生存期間 (MST) 53か月であった。Group 2 (赤) はIIB/IIIA期でPS 0-1、MST 16か月であった。Group 3 (緑) はIIB/IIIA期PS 2、またはIIIB/IV期PS 0、またはIIIB/IV期かつ81歳未満PS 1の患者を含み、MST 8か月であった。Group 4 (橙) はIIB/IIIA期PS 3-4、またはIIIB/IV期PS 2-4、またはIIIB/IV期かつ80歳超PS 1の患者で構成され、MST 3か月であった。この分類は、臨床試験の患者層別化に有用な判別性を示した。組織型は全体としてはPS、年齢、性別よりも寄与が小さかったが、ステージIIIAでは扁平上皮型が他組織型より予後良好な独立因子であることが示唆された (Table 4)。
進行NSCLCの検査値による予後因子解析: 進行NSCLC(ステージIIIB/IV)の7,280例中、一部のサブセットで検査値が利用可能であった。全5検査値(Ca、アルブミン、Na、Hb、WBC)を保有する537例での多変量モデルでは、PS (p<0.0001, HR 1.44) とWBC > 10,000/µL (p<0.0001, HR 1.60) が最も強力な独立予後因子であった。次いで、Ca > 10.4 mg/dL (p=0.0077, HR 1.77)、アルブミン < 3.2 g/dL (p=0.013, HR 1.33)、年齢 ≥ 75歳 (p=0.0415, HR 1.39) が独立予後因子として確認された (Table 6)。これらの検査値は、PSと同様に進行NSCLCの予後を予測する上で重要な役割を果たす可能性が示された。
SCLCにおける全般特性の多変量解析: 6,609例のSCLC患者を対象とした解析では、進展型 (ED) が限局型 (LD) と比較してHR 2.13 (95% CI 2.02-2.25, p<0.001) と最も強い予後因子であった。PSも独立した予後因子であり、PS 1はHR 1.36 (95% CI 1.28-1.44, p<0.001)、PS 2はHR 1.93 (95% CI 1.78-2.09, p<0.001)、PS 3-4はHR 3.45 (95% CI 3.05-3.89, p<0.001) であった。男性(HR 1.25, 95% CI 1.19-1.32, p<0.001)および年齢(連続変数、HR 1.01/年, p<0.001)も独立予後因子として確認された (Table 7)。LD単独解析 (n=2,870) およびED単独解析 (n=3,739) でも同様にPS、性別、年齢が独立因子として確認された (Table 8)。
SCLC RPA解析による4群分類: SCLC患者の学習セット4,359例および検証セット2,250例を用いたRPA解析により、4つの異なる予後グループが識別された (Figure 3, Figure 4)。Group 1 (青) はLDかつPS 0かつ60歳未満、またはLDかつPS 1-2かつ65歳未満の患者を含み、MST 17か月であった。Group 2 (赤) はLDかつPS 1-2かつ65歳以上、または女性EDかつPS 0かつ65歳未満の患者で構成され、MST 12か月であった。Group 3 (緑) は女性EDかつPS 0かつ65歳以上、または男性EDかつPS 0、またはEDかつPS 1かつ70歳未満の患者を含み、MST 10か月であった。Group 4 (橙) はLDかつPS 3-4、またはEDかつPS 1かつ70歳以上、またはEDかつPS 2-4の患者で構成され、MST 6か月であった。ステージとPSが最も重要な分割因子であった。
SCLCの検査値による予後因子解析: SCLCの6,609例中、一部のサブセットで検査値が利用可能であった。全5検査値保有の650例での多変量モデルでは、ステージED (HR 1.931, p<0.0001)、男性 (HR 1.336, p=0.0007)、PS (HR 1.283, p<0.0001)、アルブミン < 3.2 g/dL (HR 1.385, p=0.0168) が独立予後因子となった (Table 10)。SCLCにおいてアルブミン低値が大規模データで独立予後因子と同定されたのは本研究が初めてである。Na < 135 mmol/Lも有意な因子として同定された (HR 1.221, p=0.0483)。
考察/結論
本研究は、IASLCの世界最大規模データベース(NSCLC 12,428例、SCLC 6,609例)を用いて、肺癌の予後において臨床ステージに加えてPSが最も重要な追加予後因子であり、年齢・性別も独立した有意な予後因子であることを、過去の小規模cooperative group研究(NSCLC 893-2,631例、SCLC 614-2,580例)を遥かに上回る統計的検出力で確認した。
先行研究との違い: これまでの研究は主に進行期の患者に限定されていたが、本研究は全ステージを包含したNSCLCのRPA予後モデル(4群、MST 53/16/8/3か月)と、SCLCのRPA予後モデル(4群、MST 17/12/10/6か月)を構築した点で、既存の報告と大きく異なる。これにより、臨床試験の患者層別化や予後予測、治療決定に直接応用可能な、より包括的な知見を提供した。特に、IASLC提案のTNM第7版ステージングとこれらの追加因子との相互作用を評価したことは、これまでの研究では手薄であった領域である。
新規性: NSCLCステージIIIA限定で扁平上皮型が他組織型より予後良好であるという新知見は、本研究で初めて大規模データで示されたものであり、ステージIIIA試験での組織型層別化の必要性を示唆する。また、SCLCにおいてアルブミン低値が大規模データで独立予後因子として同定されたのも、これまで報告されていない新規の所見である。これらの発見は、肺癌の病態理解を深め、個別化医療の基盤を強化する上で重要な意義を持つ。
臨床応用: 進行NSCLCでは高Ca血症、WBC上昇、アルブミン低値が、SCLCではアルブミン低値が臨床ステージを越えた独立予後因子として同定され、これらは治療層別化の候補として臨床応用が期待される。RPA解析で得られた予後グループは、患者の層別化や個別化医療の推進に役立つ臨床的意義を持つ。例えば、予後不良群に属する患者に対しては、より積極的な治療戦略や支持療法を検討するなど、治療方針の最適化に貢献する可能性がある。
残された課題: 本研究の限界として、(1) 後向きデータベース起因の欠測データ(分子マーカーやPETスキャンデータ不使用)、(2) 治療の異質性(治療効果の影響は未調整)、(3) 多重検定、(4) IASLC加盟施設の地域バイアスが挙げられる。これらの結果は仮説生成的と位置付けられ、今後の検討課題として、IASLCが予定する前向き検証研究での確認が必要である。特に、分子マーカーやPET-SUVmaxなどの新たな予後因子の組み込みは、将来のモデル改善に向けた重要な方向性である。本解析はTNM第7版改訂の科学的基盤として活用され、以降の肺癌予後モデル開発と治療層別化の礎石となった研究である。
方法
本研究は、IASLCデータベースに登録された100,869例から、研究期間(1990-2000年)、新規診断時登録、組織型・ステージ・治療・追跡情報が十分な症例を抽出した大規模な後向きコホート解析として実施された。最終的に、臨床ステージ、年齢、性別、PS、組織型すべてが利用可能なNSCLC 12,428例、SCLC 6,609例(限局型 (LD) 2,870例、進展型 (ED) 3,739例)を解析対象とした。検査値(血清カルシウム (Ca)、アルブミン、ナトリウム (Na)、ヘモグロビン (Hb)、白血球数 (WBC))は一部のサブセットで利用可能であった。これらの検査値は、施設間の単位整合性を確認した後、各検査項目の正常範囲上限・下限に基づいて二値化された。例えば、高Ca血症はCa > 10.4 mg/dL、低アルブミン血症はアルブミン < 3.2 g/dLと定義された。
統計解析には、Cox比例ハザード回帰分析(SAS PHREGプロシージャ)およびrecursive partitioning and amalgamation (RPA) 解析を用いた。RPA解析では、ランダムに選択された学習セット(全体の2/3)で予後グループを構築し、残りの検証セット(全体の1/3)でその妥当性を確認した。NSCLCとSCLCでそれぞれ独立した学習セットと検証セットが設定された。このランダム選択プロセスは、データベース提出の種類(臨床試験、レジストリ、コンソーシアム/外科シリーズ)および症例登録期間(1990-1995年 vs 1995-2000年)によって層別化された。RPA解析は、生存データに対してログランク検定統計量を用いてツリーベースモデルを生成し、重要なグループ化を選択し、ブートストラップ再サンプリングにより分割アルゴリズムの適応的性質を補正した。末端ノードは類似のハザードに基づいてグループ化され、新たに形成されたグループはそれぞれ残りの1/3のデータを用いて評価された。
多数の統計検定が実施されたため、多重比較を考慮し、有意水準はp<0.01に設定された。この解析は後向きデータベースに基づいているため、分子マーカーやPETスキャンなどのデータは含まれていない。