• 著者: Kumar S, Warrell J, Li S, McGillivray PD, Meyerson W, Salichos L, et al.
  • Corresponding author: Gerstein MB (Yale University); Khurana E (Weill Cornell Medicine); Getz G (Broad Institute)
  • 雑誌: Cell
  • 発行年: 2020
  • Epub日: N/A
  • Article種別: Original Article
  • PMID: 32084333

背景

癌ゲノムは、腫瘍増殖を積極的に促進する少数のドライバー変異と、機能的影響が中立的であると伝統的に仮定されてきた大多数のパッセンジャー変異から構成されると考えられてきた。PCAWG (Pan-Cancer Analysis of Whole Genomes) コンソーシアムは、50癌種2,658例の全ゲノムシーケンス (WGS) データを統一パイプラインで処理し、ドライバー遺伝子と非コードドライバー要素を同定した (Campbell et al. 2020)。しかし、このデータセット中に存在する約4,400万個の体細胞SNVのうち約99%を占めるパッセンジャー変異の分子機能的影響は、従来「ゼロ」として扱われてきた。この仮定は、個々の変異の効果が微小であっても、一腫瘍あたり数万個のパッセンジャー変異が集積すれば、無視できない総影響が生じうる可能性を無視している点で、知識ギャップが残されている。

特に、非コード領域の変異は、TERTやBCL2プロモーター変異といった特殊なケースを除き、個別の統計的有意性を持ちにくいという課題があった (Melton et al. 2015)。そのため、転写因子 (TF) 結合モチーフへの機能的影響という観点からの体系的な評価が不足していた。また、ゲルムライン複合形質研究で有用な「加法的効果モデル」が癌ゲノム研究に応用されたことはなく、弱いドライバー変異やパッセンジャー変異の集積的効果を定量化する枠組みが未確立であった (Purcell et al. 2009; Yang et al. 2010)。これらの背景から、パッセンジャー変異の全体的な機能的影響と癌の表現型への寄与を包括的に評価することが、癌ゲノム研究における重要な知識ギャップとして残されていた。本研究は、この知識ギャップを埋めることを目的としている。

目的

本研究の目的は、ICGC/TCGA PCAWG WGSコホートの2,658例を対象に、以下の点を検証することである。(1) パッセンジャー変異の機能的重要度を多次元スコア (FunSeq2) で定量化し、高・中・低影響の三群に分類すること。(2) TF (転写因子) 結合モチーフの破壊・獲得イベントを癌種横断的に統計的に評価し、その機能的帰結を明らかにすること。(3) パッセンジャー変異の集積的効果が癌表現型に追加的に寄与する程度を、ゲルムライン複合形質研究から転用した加法的分散モデルを用いて推定すること。(4) パッセンジャー変異の分子機能的影響が、サブクローン構造、変異シグネチャー、および患者生存とどのように相関するかを解析することで、「パッセンジャー変異は機能的に中立である」という従来の仮定を検証すること。

結果

パッセンジャー変異の三群機能的分類: FunSeqスコアの分布は非コード変異において三峰性を示し、高影響ドライバー (スコア4–5)、中影響putative passenger (スコア2–3)、低影響中立 (スコア0–1) の3群が識別された (Figure 1A)。全変異の大多数 (約99%) はスコア0–1に分布し、スコア2–5の変異が中・高影響群を構成した (解析対象: n = 2,658例)。中影響パッセンジャーは代謝遺伝子、免疫応答遺伝子、必須遺伝子に優位に存在した。高変異負荷腫瘍では高影響パッセンジャーの割合が低下する傾向があり (p < 0.001)、これは弱い負の選択の証拠として解釈された (Figure 1B)。

DNA修復遺伝子でのパッセンジャーLoF (Loss-of-Function) 枯渇: ドライバーLoF変異がMLH1、MSH2、MSH6、PMS2などのDNA修復遺伝子で有意に富化していたのとは対照的に、パッセンジャーLoF変異はDNA修復遺伝子で有意に枯渇していた (p < 0.001、均一バックグラウンドに対する相対比較) (Figure 2A)。シグネチャー補正後の解析では、枯渇はDNA修復遺伝子に加え、細胞周期、癌経路、アポトーシス関連遺伝子にも拡大した (Figure S2A)。これは、DNA修復遺伝子をパッセンジャーが偶発的に破壊すると変異率が亢進するmutator phenotypeが誘導されるため、自然選択によって除去されるという「間接的負の選択」機構と一致する。腎細胞癌 (RCC) ではLoF変異率がT>A置換の相対頻度が高く (18% vs pan-cancer平均8%)、癌種特異的な変異スペクトラムがLoFパターンに影響することが示された (Figure 3A)。

TF (転写因子) 結合モチーフの破壊・獲得シグナル: 均一バックグラウンドモデルでは、GATA、PRRX2、SOX10結合モチーフ獲得イベントが多癌種で有意に富化し、SP1、EGR1、EP300、ETSファミリー結合モチーフ破壊イベントが有意に富化した (Figure 2B)。シグネチャー補正バックグラウンドによる再解析では、STAT、PRRX2、SOX10のモチーフ獲得とHNF4、ETS、SP1のモチーフ破壊が有意に富化した (Figure S2B)。個別遺伝子への機能的帰結として、ETSファミリー結合モチーフへのゲイン変異はTERT遺伝子の発現上昇と有意に相関し (p < 0.001)、BCL2の5’UTR近傍ETS-gainも発現亢進と関連した (p < 0.001) (Figure 2D)。皮膚黒色腫ではETSモチーフ破壊がRPS27遺伝子の発現低下と関連した。これらの変異は、既知の「ドライバー的noncoding変異」 (TERTプロモーターSBS5/7等) とは独立したパッセンジャー変異プールから生じる場合があり、ドライバー・パッセンジャーの二分法の限界を具体的に示した。

パッセンジャー変異集積の表現型説明分散 (+12%): ゲルムライン複合形質研究の加法的効果モデルをパッセンジャー変異に適用し、ドライバー変異単独が説明する癌表現型の分散に対してパッセンジャー変異を集積スコアとして追加した際の説明分散の増加量 (Δvariance) を推定した。この値は複数癌種の中央値で約12%の追加説明分散をもたらした (Figure 5C)。すなわち、個々の効果がゼロに近いパッセンジャー変異も、腫瘍あたり数千〜数万個の集積として癌表現型 (転写プロファイル等) に統計的に有意な寄与をする。この効果は既知ドライバーが同定されていない腫瘍や、期待より少ないドライバーしか持たない腫瘍で特に顕著であり、パッセンジャー変異プール中に含まれる「弱いドライバー (mini-drivers / deleterious passengers)」の存在を示唆する。ドライバー変異を含まないサンプル (n=20 samples) では、パッセンジャー変異が平均12.5%の追加説明分散を示し、これは全サンプルでの推定値9.5%よりも有意に高かった (p = 0.01)。

サブクローン構造との相関: 早期・後期サブクローン間のパッセンジャー分布を比較したところ、コード領域の高影響パッセンジャーは腫瘍抑制遺伝子・アポトーシス遺伝子に優位に早期サブクローンに蓄積しており、同じ高影響パッセンジャーがDNA修復・細胞周期遺伝子では早期サブクローンで枯渇していた (Figure 4A)。これは高影響パッセンジャーが方向性をもって選択されることを示す。また、高影響パッセンジャーはVAF (Variant Allele Frequency) の変動 (腫瘍内不均一性の指標) が低く、クローン性が高い傾向があった (p < 0.001、コード・非コード変異ともに有意) (Figure 4B)。VAF-GERP相関解析では、ドライバー遺伝子内では保存位置を破壊する変異ほど高VAFで優位だった一方、非ドライバー遺伝子外では保存位置破壊変異ほど低VAFを示し、弱い負の選択を示唆した (Figure 4C)。生存解析では、リンパ性白血病 (Lymph-CLL: p = 0.00023) と卵巣腺癌 (Ovary-AdenoCA: p = 0.002) で分子機能的影響負荷が予後と有意に相関し、高平均GERP患者で生存が良好であった (Figure 4D)。

考察/結論

本研究は、「パッセンジャー変異は機能的に中立である」という癌ゲノム研究の中心的仮定に系統的な疑問を呈した最初の大規模WGS研究である。FunSeq2スコアを用いた多次元解析により、パッセンジャー変異は均質な中立集団ではなく、高・中・低影響の三群に連続的に分布することが明らかとなった。特に、約12%の追加説明分散という数値は統計的に有意であり、個々の効果が微小であっても、腫瘍の転写プロファイルや細胞表現型に対するパッセンジャー変異の集積的貢献が実質的なものであることを示す。

先行研究との違い: 本研究は、Vogelstein et al. Science 2013Weinstein et al. NatGenet 2013といった先行研究が主にドライバー変異に焦点を当てていたのと対照的に、パッセンジャー変異の全体的な機能的影響を包括的に評価した点で異なる。

新規性: 本研究で初めて、ゲルムライン複合形質研究から転用した加法的効果モデルを癌ゲノム研究に応用し、パッセンジャー変異の集積的効果が癌表現型の説明分散を既知のドライバー変異に加えて約12%増加させることを新規に示した。これは、Lawrence et al. Nature 2014が示したドライバー飽和解析の限界を補完する新規の知見である。また、FunSeqスコアは、開放クロマチン、TF結合、保存性、接触頻度を統合した多次元スコアであり、今後の非コード変異の機能的優先付けに汎用的に使用できるリソースとなる。

臨床応用: DNA修復遺伝子でのパッセンジャーLoF枯渇が示す間接的負の選択は、パッセンジャー変異が受動的に蓄積するだけでなく、変異誘導能を持つ遺伝子への偶発的損傷が選択的に除去されるという動的な進化プロセスの証拠として重要である。また、ETS結合モチーフゲインによるTERT発現亢進は、いわゆる「ドライバー的パッセンジャー」が統計的なドライバーカタログに含まれない形でも機能的影響を持ちうることを具体的に示した。これらの知見は、非コード領域を含む精密医療の拡張に繋がる臨床的意義を持つ。

残された課題: 今後の検討課題として、(1) パッセンジャー変異集積の因果的影響 (治療抵抗性や転移能に直接寄与するかの証明)、(2) パッセンジャー蓄積の時系列 (初期vs後期の腫瘍形成への寄与)、(3) FunSeqスコアの癌種間一般化可能性と他の機能的アノテーションスキームとの整合性、(4) パッセンジャー変異がマイクロRNA標的配列・スプライシング調節にもたらす影響の評価が挙げられる。また、微弱なドライバー効果を持つパッセンジャーを個別に同定する手法の開発が、非コード領域を含む精密医療の拡張に不可欠の課題として残されている。

方法

ICGC/TCGA PCAWGの44癌種2,658例 (WGS) から得られた体細胞SNV合計約4,400万個を解析対象とした。機能的重要度の定量化にはFunSeq2 (Functional Sequence 2) スコアを用いた。FunSeq2は、種間保存性 (GERPスコア)、TF結合、クロマチン状態、染色体ループ、発現相関など18の特徴を統合した0–5のスコアを各変異に割り当てる (Fu et al. 2014)。TF結合モチーフの変化 (破壊・獲得) の富化は、MotifBreakRおよびde novo解析で評価し、均一バックグラウンドモデルとシグネチャー補正バックグラウンドモデルの両方で検定した。

パッセンジャー変異集積の表現型予測能 (説明分散の追加量; Δvariance explained) は、ゲルムライン複合形質研究から転用した加法的効果モデルを用いて、癌種別の線形モデルで推定した。このモデルでは、既知のドライバー変異が説明する分散に加えて、パッセンジャー変異の集積スコアが癌表現型(例: 転写プロファイル)にどの程度追加的に寄与するかを定量化した。サブクローン解析は、PCAWG Gerstung et al. (2020) の結果を利用し、早期・後期サブクローンへのパッセンジャー変異の帰属を検討した。早期サブクローンは親サブクローンを持たないもの、後期サブクローンは親サブクローンを持つが子サブクローンを持たないものと定義された。

生存解析では、患者年齢を共変量とした多変量Cox比例ハザードモデルを適用し、分子機能的影響負荷 (患者あたりのGERPスコア平均値) と予後の相関を癌種別に評価した。解析には、少なくとも10例の死亡が確認された9種類の癌種 (乳腺腺癌、CNS-GBM、食道腺癌、腎細胞癌、肝細胞癌、リンパ性白血病、卵巣腺癌、膵腺癌、皮膚黒色腫) が含まれた。統計的有意性は、Kolmogorov-Smirnov (KS) 検定、Wilcoxon順位和検定、カイ二乗検定、およびログランク検定を用いて評価された。多重検定補正も適用された。