• 著者: H. Tang, S. Wang, G. Xiao, J. Schiller, V. Papadimitrakopoulou, J. Minna, I.I. Wistuba, Y. Xie
  • Corresponding author: Y. Xie (UT Southwestern Medical Center, Dallas, TX, USA)
  • 雑誌: Annals of Oncology
  • 発行年: 2017
  • Epub日: N/A
  • Article種別: Review
  • PMID: 28200038

背景

非小細胞肺癌 (NSCLC) は肺癌全体の約85%を占め、現行の治療ガイドラインは主に臨床的・病理学的病期分類、喫煙歴、性別などの因子に基づいている。しかし、外科的切除後であっても、ステージI/IIのNSCLC患者の約40%が最終的に疾患再発により死亡するという厳しい現実があり、臨床的アウトカムには大きな個人差が存在する。この不均一性から、再発リスクの高い患者を術後早期に層別化し、個別化治療計画を策定することが強く求められている。

2001年以降、ゲノムワイドmRNA発現プロファイリング技術の進展により、NSCLCの予後予測を目的とした多数のmRNA発現シグネチャーが報告されてきた。しかし、これらシグネチャーの再現性・堅牢性・実際の臨床的有用性については長年にわたり議論が続いており、Subramanian と Simon (J Natl Cancer Inst 2010) は「多くの予後シグネチャーは臨床使用に向けた準備が不十分である」と指摘し、さらに同著者ら (Nat Rev Clin Oncol 2010) は評価基準の在り方についても問題提起を行っている。さらに Venet et al. (PLoS Comput Biol 2011) は乳癌の予後シグネチャーを対象に「多くがランダムに生成したものと有意差がない」と主張し、遺伝子発現シグネチャー全体の臨床的有用性に疑問を呈した。

このような議論がある一方で、EGFR 変異や EML4-ALK 融合遺伝子に代表される分子標的治療の急速な発展により、NSCLC の治療戦略は大きく変容しつつある。Lynch et al. NEnglJMed 2004 が示したように、EGFR 変異はゲフィチニブ奏効を予測する重要なバイオマーカーであり、また Mok et al. NEnglJMed 2009 の試験では EGFR 変異陽性肺腺癌患者においてゲフィチニブが化学療法を大きく上回る有効性を示した。しかし EGFR 変異陰性の患者群でも TKI (チロシンキナーゼ阻害薬) から一部が恩恵を受けることが報告されており、変異プロファイルのみでは治療選択の全体像を捉えきれない。このような背景から、mRNA 発現プロファイルが変異情報を補完し、より包括的な予後予測・薬剤応答予測をもたらしうる可能性が注目されている。また Byers et al. ClinCancerRes 2013 は EMT (上皮間葉転換) 遺伝子シグネチャーがエルロチニブ感受性を EGFR 変異野生型でも予測することを示しており、mRNA シグネチャーの付加価値を裏付けている。

これまでのレビュー研究は個々のシグネチャーの概要を示すに留まり、複数のシグネチャーを同一の統計手法・同一の大規模患者コホートを用いて体系的に比較評価した試みは手薄であった。特に、(1) 複数の独立データセット横断的な予後予測性能、(2) ランダム生成シグネチャーとの比較における実質的優位性、(3) 既知臨床因子とは独立した付加的予測力、の3軸を同時に検証した研究は存在しないという gap in knowledge が存在した。本研究はこのギャップを埋めることを目的としている。

目的

切除 NSCLC 患者における公表済み mRNA 予後シグネチャーを系統的にレビューし、大規模メタ解析によって包括的に評価することで、高額かつ長期にわたる前向き臨床試験での検証に最も適した有望なシグネチャーを同定する。評価軸は (1) 異なる研究間での生存アウトカム予測能、(2) ランダムシグネチャーとの比較における有意な優位性、(3) 病期・年齢・喫煙歴などの既知臨床リスク因子とは独立した予後予測力、の3点とし、腺癌 (ADC) および扁平上皮癌 (SCC) の組織型別評価も行う。

結果

シグネチャーの同定とコホートの概要: 文献検索により、ゲノムワイド発現プロファイリング解析から導出された42の肺癌予後シグネチャー (各 ≤500 遺伝子) を同定した。これらのシグネチャーは ADC、SCC、混合組織型、さらには乳癌由来 (94遺伝子悪性度リスクシグネチャー) など多様な背景を持ち、Affymetrix・Agilent・カスタマイズアレイなど異なるマイクロアレイプラットフォームが使用されていた。評価には15研究から収集した合計 n=1,927 例の早期切除 NSCLC 患者データを使用した。これらの15データセットは患者生存アウトカム・組織型・腫瘍ステージの点で大きな不均一性を有しており (supplementary Tables S2-S4)、多様なコホートを使用することでシグネチャー評価の汎化性を担保した (Figure 1)。

全体メタ解析:予後予測能の確認: SuperPCA モデルを用いたメタ解析の結果、42シグネチャー中34シグネチャー (81%) が高リスク群と低リスク群を統計学的に有意に分離した (HR の95% CI 下限 > 0, p<0.05) (Figure 2C, 2D)。代表例として、Shedden et al. のシグネチャー (452遺伝子) はメタ解析で HR 1.80 (95% CI 1.10-2.93) と有意な予後予測能を示した。同シグネチャーを Director’s Consortium データセットで訓練した場合、テストセットによって HR が 0.817 から 3.113 の範囲と大きく変動することが示され (Figure 2A)、単一のテストセットに基づく評価では結論にバイアスが生じうることが明確となった。また HR・C.index・AUC のいずれの指標でも上位シグネチャーの順位は非常に類似しており (Figure 2C-E)、評価指標によらず結果の頑健性が確認された。

訓練データセットによる性能の差異も観察された。Tomida データセットを訓練セットとした場合、全42シグネチャーの少なくとも80%の遺伝子をカバーするため多くのシグネチャーで良好な訓練モデルが得られた一方、RoepmanCCR データセットでは42シグネチャーのうち33シグネチャーしか80%カバーを達成しておらず、訓練性能が相対的に劣っていた。このことは、訓練データセットの遺伝子カバレッジがシグネチャー評価性能に影響する重要な因子であることを示している (Figure 2B)。

ランダムシグネチャーとの比較:約半数が有意に優位: SuperPCA モデリングアプローチを用いた場合、42の公表済みシグネチャー中20シグネチャー (48%) がランダムシグネチャー (各50遺伝子・100セット) を有意に上回る性能を示した (p<0.05) (Figure 3A)。注目すべき点として、これらランダム優位シグネチャーの一部は比較的少数の遺伝子しか含まず、5遺伝子の Kadara シグネチャーや4遺伝子の Mitra シグネチャーなど小規模シグネチャーも含まれていた。遺伝子数の多少よりもシグネチャーの内容・生物学的妥当性が予後予測力を規定する可能性を示唆する知見である。

一方、教師なし PCA アプローチでは、42シグネチャー中9シグネチャー (21%) のみがランダムシグネチャーより有意に優れており (Figure 3B)、SuperPCA の20シグネチャー (48%) と大きな乖離が見られた。この理由として、教師なし PCA では中央値生存時間に基づいて高リスク群・低リスク群を定義する際に生存情報を2回使用 (モデリング段階と評価段階) するため、ランダムシグネチャーの性能を過大評価し、真のシグネチャーとの差を実質的に過小評価することが示された。このバイアスを回避するためには、独立した訓練・検証データセットを用いる教師ありアプローチが不可欠であることが本研究で実証された。なお、ランダムシグネチャーを各100遺伝子で再実施した場合も同様の結果が得られており、遺伝子数の設定によらず結論は頑健であった。

多変量解析:臨床因子独立の予後予測力: 腫瘍組織型・病期・患者年齢・喫煙歴などの臨床的予後因子を調整した多変量 Cox モデルによる解析では、単変量解析で有意な予後予測能を示した35シグネチャーのうち29シグネチャー (83%) が多変量調整後も有意な予後予測力を保持していた (Figure 4A, 4B)。さらにこの29シグネチャーのなかで、ランダムシグネチャーとの比較でも有意に優れた性能を示したものが25シグネチャーと定義された。これらのシグネチャーは、病期・年齢・喫煙歴などの標準的な臨床情報とは独立して予後情報を提供できることを示しており、既存の臨床病理学的因子では把握しきれない分子生物学的な予後情報を付加的に提供できることを示している。特に、Figure 4B の forest plot では各シグネチャーの HR の推定値と95% CI が明示されており、シグネチャー間での性能の定量比較が可能となっている。

組織型別解析:ADC vs SCC の比較: ADC と SCC ではその分子的背景が異なることから、組織型別のサブグループ解析を実施した。ADC 患者 (n=全体の約60%) においては、42シグネチャー中17シグネチャー (45%) がランダムシグネチャーより有意に優れた予後予測能力を示した (p<0.05)。上位シグネチャーの詳細は Table 1 に示され、Chen2 (Chen second-cohort lung adenocarcinoma signature, 92遺伝子, HR 1.69, 95% CI 1.56-1.83, Q=63.29, p=5.54E-16)、Shedden_c シグネチャー (452遺伝子, HR 1.72, 95% CI 1.56-1.89, Q=51.73, p=5.55E-14)、Kadara シグネチャー (5遺伝子, HR 1.67, 95% CI 1.53-1.81, Q=59.15, p=2.70E-13) が最上位に位置した。また Tomida1_a (Tomida first-cohort lung adenocarcinoma signature, 23遺伝子, HR 1.41, 95% CI 1.30-1.52)、Lu1 (Lu lung recurrence prediction signature, 62遺伝子, HR 1.47, 95% CI 1.33-1.63)、Xie (59遺伝子, HR 1.54, 95% CI 1.42-1.66) なども高い予後予測能力を示した (Table 1)。

SCC 患者では、8シグネチャー (19%) のみが有意な予後予測能力を示し、ADC に比べて有用なシグネチャーの数が少なかった。SCC における上位シグネチャーは Shedden_d (332遺伝子, HR 1.41, 95% CI 1.25-1.59, Q=84.41, p=2.19E-11) および Raponi_b (45遺伝子, HR 1.29, 95% CI 1.15-1.44, Q=50.99, p=1.54E-05) であった。SCC での有効シグネチャーが少ない原因としては、SCC は ADC と比べてゲノムワイド発現研究の対象症例数が少なく、SCC 特異的なシグネチャーの開発・検証が遅れていることが主因と考えられる (Table 1)。

興味深い発見として、ADC のみのデータセットから導出された一部のシグネチャーが SCC 患者においても有効な予後予測能力を示した。具体的には、Shedden_c (HR 1.72, 95% CI 1.56-1.89 in ADC; SCC でも有意)、Tang (18遺伝子, ADC: HR 1.39, 95% CI 1.27-1.53, p=2.58E-06; SCC: HR 1.18, 95% CI 1.07-1.29, p=4.44E-04)、Kadara (ADC: HR 1.67; SCC: HR 1.21, 95% CI 1.10-1.34, p=2.96E-05) がいずれの組織型でも有効であった。この知見は、特定の生物学的プロセス (例えば細胞増殖や免疫応答) が ADC と SCC の両方で予後と相関していることを示唆している。

シグネチャー間の一致度と収束性: 公表された42シグネチャー間での遺伝子の重複は少ないにもかかわらず (多くのシグネチャーは固有の遺伝子セットで構成)、上位パフォーマンスシグネチャーが患者アウトカム予測において高い一致性を示した点は本研究の重要な発見の一つである。HR・C.index・時間依存 ROC-AUC の3つの評価指標すべてにおいて、上位シグネチャーの順位は非常に類似しており (Figure 2C-E)、互いに異なる遺伝子セットであっても実質的には同一の生物学的情報 (おそらく細胞増殖・免疫活性・代謝などの共通経路) を捉えていることが示唆される。この収束性は、最高ランクのシグネチャー群が真の予後生物学的シグナルを捉えており、シグネチャー選択の方向性に信頼性をもたらしている。加えて本研究では、遺伝子数の少ないシグネチャー (例: Kadara の5遺伝子、Mitra の4遺伝子) も上位に位置しており、将来の CLIA 認証可能な診断アッセイ開発において少遺伝子シグネチャーが現実的な選択肢となりうることを示している (Table 1)。

考察/結論

本研究は、切除 NSCLC 患者における公表済み mRNA 予後シグネチャー42個を、同一の統計手法 (SuperPCA/PCA) と大規模患者データ (15研究 n=1,927 例) で体系的に比較評価した初の包括的メタ解析である。これまでの研究では個々のシグネチャーの性能を個別の検証コホートで評価するのみであり、複数シグネチャーを統一基準・統一データで比較した系統的評価は存在しなかった。本研究はこの gap を埋め、前向き臨床検証の優先候補を絞り込む科学的根拠を提供した点に最大の意義がある。

既報との相違: Venet et al. が乳癌において「ほとんどのシグネチャーはランダムなものと差がない」と結論したのと対照的に、本研究では SuperPCA アプローチにより 42シグネチャー中20シグネチャー (48%) がランダムシグネチャーを有意に上回ることが示された。この違いは主に (1) サンプルサイズ (Venet らは3データセットのみ vs 本研究は15データセット n=1,927 例でより大きな統計検出力)、(2) 複数の評価指標の使用 (HR のみ vs HR + C.index + 時間依存 ROC)、および (3) 解析アプローチの差異 (教師なし PCA のみ vs 教師あり SuperPCA) に起因すると考えられる。既報の研究と異なり、本研究は教師なし PCA がランダムシグネチャーの性能を過大評価するバイアス構造を有することを実証的に示し、これが以前の「ランダムと差がない」という結論を導いた主因である可能性を提示した。

新規性: 本研究で新規に示されたのは、(1) 同一の統計フレームワーク下で42シグネチャーを横断的に比較評価した初の大規模試みであること、(2) 教師なしアプローチが本質的にランダムシグネチャーの性能を過大評価するバイアスを内包することを定量的に実証したこと、(3) ADC では17個・SCC では8個という組織型別の有望シグネチャー候補リストを初めて提示したこと、の3点である。これまで報告されていない視点として、遺伝子数の少ないシグネチャー (4-5遺伝子) でも多遺伝子シグネチャーに匹敵する予後予測能力を発揮しうることが示された点も、新規な知見として評価できる。

臨床応用: 本研究で同定された有望なシグネチャーは、高リスク再発患者に対するより積極的な術後補助療法の選択や、低リスク患者への治療強度軽減といった個別化治療の意思決定に臨床的有用性をもたらす可能性がある。特に臨床的に実装可能なアッセイ開発の観点から、遺伝子数が少ない候補シグネチャー (Kadara: 5遺伝子, Mitra: 4遺伝子, Parmigiani: 14遺伝子, Bianchi: 10遺伝子) は qPCR や Nanostring nCounter プラットフォームへの変換が現実的であり、CLIA 認証取得を経た臨床現場への橋渡しが比較的容易である。また mRNA 発現プロファイルは EGFR 変異陰性患者における TKI 感受性予測 (例: EMT シグネチャー) のように、変異情報では把握できない表現型情報を補完する可能性があり、driver 変異陰性 NSCLC においてこそ mRNA 予後シグネチャーの臨床的意義が大きいと考えられる。

残された課題: 本研究にはいくつかの limitation が存在する。第一に、評価対象シグネチャーはすべてマイクロアレイ由来であり、RNA-seq や デジタル PCR 等の高感度計測技術への適用可能性は別途検証が必要である。第二に、本研究では遺伝子リストのみを評価対象とし、各シグネチャー開発時に用いられた固有の統計モデルとの組み合わせは評価していない点に制約がある。遺伝子セットと統計モデルの相互作用が予後予測性能に与える影響は今後の研究課題である。第三に、大多数の公表シグネチャーが新鮮凍結 (fresh frozen) サンプル由来であり、臨床応用に向けては FFPE サンプルでの CLIA 認証アッセイによる検証が不可欠である。第四に、mRNA シグネチャーに加えてタンパク質発現・DNA メチル化・コピー数変異・ゲノム変異との統合が予後予測精度をさらに向上させるかどうかについて、更なる検討が求められる。また本研究のデータは主に2012年以前のマイクロアレイデータセットであり、現代的な大規模コホート (TCGA 等) を用いた追試も今後の研究方向性として重要である。

方法

シグネチャー収集: PubMed データベースを Boolean 句「prognostic gene expression signature AND lung」で検索し、既報のレビュー論文も参照した。選択基準は、(1) ゲノムワイド mRNA 発現プロファイリング研究由来、(2) 独立データセットで生存アウトカムとの関連が検証済み、(3) 遺伝子数 ≤500 プローブ。この基準のもと、2001年から2012年に発表された34研究から42のシグネチャーを収集した (supplementary Table S1)。

患者コホート: Gene Expression Omnibus (GEO) および Microarray Data Management System (caArray) 等の公開データベースと文献を包括的に検索し、ゲノムワイド mRNA 発現データと生存情報を含む NSCLC 研究を特定した。50例以上の NSCLC 患者を含む15データセット (合計 n=1,927 例、早期切除 NSCLC) を評価用テストセットとして採用し、このうち患者数が100例以上の9データセットを SuperPCA (supervised principal component analysis) モデルの訓練セットとした (supplementary Table S2)。

統計手法: 各シグネチャーの予後予測能力を評価するため、SuperPCA および教師なし PCA (principal component analysis) の両手法を適用した。生存関連性の評価指標として、(1) Cox 比例ハザードモデルによるハザード比 (HR)、(2) 時間依存 ROC 曲線 (time-dependent receiver-operating characteristic curve) からの AUC、(3) 一致度指標 (C.index; Concordance Index) の3種類を使用した。複数の独立検証セットにわたる全体性能を要約するためにランダム効果モデルを用いたメタ解析を実施した。

ランダムシグネチャーとの比較: 各50遺伝子を含む100個のランダム遺伝子セットを生成し、同一の訓練・検証戦略で生存関連性を算出した。公表シグネチャーとランダムシグネチャーの性能比較には線形混合効果モデルを使用した。また多変量 Cox 回帰モデルで腫瘍組織型・病期・患者年齢・性別・喫煙歴を共変量として調整し、各シグネチャーの独立した予後予測力を評価した。組織型別解析として ADC サブグループと SCC サブグループでも別途メタ解析を実施した。解析ワークフローの全体像は Figure 1 に示されている。