• 著者: Nik-Zainal S, Van Loo P, Wedge DC, Alexandrov LB, Greenman CD, Lau KW, Raine K, Jones D, et al. (Breast Cancer Working Group of ICGC)
  • Corresponding author: Peter J. Campbell (Wellcome Trust Sanger Institute, Cambridge, UK)
  • 雑誌: Cell
  • 発行年: 2012
  • Epub日: 2012-05-25
  • Article種別: Original Article
  • PMID: 22608083

背景

癌はクローン性拡大が淘汰圧、変異プロセス、ドライバー遺伝子の破綻により動的に進化する複雑な疾患である。しかし、これらの進化プロセスが癌の発生から臨床診断に至るまでの時間軸でどのように展開するかは、これまで詳細には未解明であった。全ゲノムシーケンス技術の進展により、数千から数万に及ぶ体細胞変異が同定されるようになったが、その大部分は生物学的に無関係なパッセンジャー変異である。しかし、これらの変異のアレル頻度パターンには、腫瘍のクローン進化に関する重要な情報が暗号として含まれていることが示唆されていた。Stratton et al. Nature 2009は癌ゲノムの複雑性を指摘し、その解析が癌生物学の理解に不可欠であることを強調している。

腫瘍内不均一性は、異なる時点や空間からのサンプリング、あるいは単細胞解析によって示唆されてきたものの、ゲノム変異データから個々の癌の「生活史」を再構築するためのバイオインフォマティクスアルゴリズムは十分に確立されていなかった。特に、ダーウィン進化の動態、すなわちサブクローンがいつ、どのような順序で分岐するのか、変異プロセスが時間的にどのように変化するのか、そして優勢なサブクローンの拡大のタイミングと臨床診断との関係性といった根本的な問いが未解決の課題として残されていた。Navin et al. (2011) は単細胞シーケンスにより腫瘍進化の複雑性の一端を明らかにしたが、大規模なコホートでの普遍的なパターンは未解明であった。Armitage-Dollの古典的な数学的モデルは、癌の発生に5〜8の律速段階が必要であると予測しているが、これを分子レベルで検証するためにも、癌ゲノムの「生活史」を再構築することは重要な研究課題であった。これらの知識ギャップを埋めることは、癌の早期発見、予後予測、および個別化治療戦略の開発に不可欠であると考えられた。また、Hanahan et al. (2011) が提唱した癌のホールマークは、癌の生物学的特性を包括的に理解する枠組みを提供したが、これらのホールマークが時間軸上でどのように獲得され、腫瘍進化に寄与するのかについては、さらに詳細な研究が不足していた。

目的

本研究の目的は、新規バイオインフォマティクスアルゴリズム(Bayesian Dirichlet processおよびBattenbergアルゴリズム)を開発し、これらを21例の乳癌の全ゲノムシーケンスデータに適用することで、個々の腫瘍のゲノム履歴を詳細に再構築することである。具体的には、癌のクローン進化の動態、サブクローン多様化のパターン、変異シグネチャの時間的変化、およびドライバー変異のタイミングを解明し、乳癌発生の普遍的なモデルを提示することを目指した。これにより、乳癌の発生から診断に至るまでの分子イベントの時間的順序を明らかにし、癌の進行における律速段階を特定することを意図した。特に、腫瘍内不均一性の程度と、それが癌の臨床的検出にどのように寄与するかを定量的に評価することを目的とした。

結果

188倍深度シーケンス腫瘍PD4120aの精密サブクローン解析: 188倍のシーケンス深度で解析された腫瘍PD4120aでは、合計70,690個の体細胞置換が同定された。変異アレル頻度とリード深度のプロットは、4つの明確なクラスターを示した。Bayesian Dirichlet processによる解析の結果、クラスターDは全腫瘍細胞に存在する変異で、推定26,762変異(95%事後区間22,378〜31,160)を含んでいた。サブクローナル変異として、クラスターC(変異アレル頻度約19%、推定約15,600変異)、クラスターB(変異アレル頻度約11%)、および最も稀少なサブクローン集団であるクラスターA(変異アレル頻度約5%)が同定された (Figure 1C, D)。この詳細な解析により、PD4120aのゲノム進化の複雑なサブクローン構造が明らかになった。n=1 tumor cell sampleの解析は、高深度シーケンスがサブクローナル変異の検出に極めて有効であることを示した。

PD4120aにおけるサブクローン系統の再構築: 変異フェージング解析とBattenbergアルゴリズムを用いたサブクローナルコピー数変化の検出により、クラスターBとCが相互排他的な異なる系統に属することが実証された。特に、染色体13のサブクローナル欠失(del13)はクラスターCと同じ系統に属し、クラスターC変異よりも早期に生じたことが示された (Figure 2A, B, C)。染色体13上の2,171変異のうち、756変異(35%)がフェージング可能であり、クラスターCの変異はすべて予測通り保持コピーにのみ存在していた。最終的な系統樹再構築では、クラスターC(腫瘍細胞の65%)がdel13を持つ主要系統、クラスターB(18%)が多数の染色体喪失を持つ副系統(さらに四倍体サブクローン14%に分岐)、クラスターA(14%)が第3の系統を形成し、これらがmost-recent common ancestor (MRCA) の全子孫を説明することが示された (Figure 3D)。この結果は、複数のサブクローン系統が並行して進化し、腫瘍内に不均一な集団を形成することを示唆する。

全21腫瘍におけるサブクローン多様化の普遍性: 全21腫瘍においてサブクローナル変異が検出され、多くの腫瘍では完全クローナル変異よりもサブクローナル変異の数が多かった (Figure 6A)。最も重要な所見として、すべての腫瘍で腫瘍細胞の50%〜95%を占める優勢なサブクローン系統が存在した。この優勢なサブクローンは、MRCAから数百〜数千の変異が蓄積してから初めて拡大が始まることが、pigeonhole principleに基づく論理的帰結として示された。サブクローナルコピー数変化のパターンは症例間で多様であり、PD4088aやPD4248aはほとんどサブクローナルコピー数バリアント (CNV) 変化がなかったのに対し、PD3851a、PD4085a、PD4116aはゲノムの大部分がサブクローナルコピー数変動を示した (Figure 6C)。これらの結果は、乳癌における腫瘍内不均一性が普遍的な現象であることを裏付ける。

染色体ゲインのタイミング: 16例の情報提供可能なゲノムでは、染色体スケールのゲインが点変異時間の15〜20%が経過した後にはじめて始まり、その後多くの腫瘍で継続的に蓄積することが示された (Figure 4)。これは、大規模な染色体不安定性が乳癌進化の最初期のドライバーではなく、ある程度の変異が蓄積した後に始まる過程であることを示唆する。また、10例で全ゲノム倍加の証拠が認められ、これも一般的に点変異時間の50%超が経過した後の後期イベントであった。5例の既知癌遺伝子(ERBB2×3、MYC×1、CCND1×1)のゲノム増幅は、いずれも増幅初期(全コピーへの変異がない)に駆動イベントが発生したことが示された。これらの増幅は、複数段階のゲノム再構成によって生じた可能性が示唆される。

変異プロセスの時間的変化: 14例で早期(コピー数ゲイン前)と後期(コピー数ゲイン後)の変異スペクトルを比較した結果、そのうち11例で統計的に有意な差が認められた(カイ二乗検定、いくつかの症例でp < 0.0001)。最も一貫したパターンは、10/14例でC>T転換が早期変異に占める割合が後期より有意に高いことであった(多くの症例でp < 0.005)。後期ではAPOBEC関連のC>GおよびC>TのTpCコンテキスト変異(シグネチャBおよびE)が増加した。non-negative matrix factorization (NMF) 解析では5つのシグネチャを同定し、シグネチャA(CpGでのC>T、初期ドミナント)、シグネチャB(TpCでのC>T/G/A)、シグネチャC・D(均一なプロセス)、シグネチャE(TpCpA/C/TでのC>G、後期・サブクローナルにドミナント)が8サンプルで確認された (Figure 5A, B)。Kataegis(局所的TpCコンテキスト変異クラスター)はゲノム再構成と密接に関連し、PD4103aでは染色体12を含む増幅巣に複数のkataegisクラスターが異なるploidy levelで存在し、増幅が段階的なゲノム再構成によって生じたことを示した (Figure 5C)。これらの結果は、変異プロセスが癌進化の異なる段階で変化することを示している。

ドライバー変異のタイミング: MRCA出現以前の共有幹(trunk)には、TP53、PIK3CA、GATA3、MLL3、SMAD4、NCOR1変異、ならびにtrisomy 1qがすでに蓄積していた。PD4120aでは、1q上の変異が7例(増幅前)と1,250例(増幅後)と対照的であり、mutator表現型はtrisomy 1q獲得後にのみ明確であった(p < 0.0001、カイ二乗検定)。これは、特定のドライバーイベントが変異プロセスの変化を誘発する可能性を示唆する。n=21 breast cancer samplesの解析により、初期のドライバー変異が腫瘍の進化経路を決定する上で重要な役割を果たすことが示された。

考察/結論

本研究は、個々の癌のゲノム履歴を解読するための包括的なフレームワークを確立した。得られた知見から、乳癌の発生について以下の統合モデルが提示される (Figure 7)。乳腺器官形成から成人での診断に至る数十年間にわたって、正常乳腺幹細胞系譜が受動的に多くの変異を蓄積する(この間の細胞は増殖せず休止状態にある)。その後、少数のドライバー変異の獲得に伴って選択的クローン拡大が起き、最終的にドミナントサブクローンの大規模拡大が腫瘍の臨床的検出の律速段階となる。

新規性: 本研究で初めて、すべての乳癌において腫瘍細胞の50%超を占める優勢なサブクローン系統が存在し、このサブクローンが数百〜数千の変異蓄積後に初めて拡大することが実証された。この発見は、乳癌の診断が、最初の癌化イベントではなく、優勢なサブクローンの拡大によって引き起こされる最終律速段階であるという新規な概念を提示する。

先行研究との違い: 急性骨髄性白血病では後期にサブクローナル変異が少ないという既報の報告と対照的に、本研究の乳癌では変異プロセスの時間的変化が顕著であり、初期の乳癌ではCpGでのC>T転換が主要プロセスであるのに対し、後期ではAPOBEC活性等のがん特異的変異プロセスが増大することが示された。これは、腫瘍タイプによって進化動態が異なることを示唆し、これまでの癌進化モデルに新たな視点を提供する。

臨床応用: これらの所見は、腫瘍内不均一性 (intratumor heterogeneity) の理解と治療標的選択に重要な臨床的意義を持つ。第一に、治療標的はMRCA以前のtrunk変異(全腫瘍細胞に共有)を優先すべきである。これにより、腫瘍細胞集団全体に効果が及ぶ可能性が高まる。第二に、ドミナントサブクローンの出現時期と対応するドライバー変化の同定が、早期介入や再発予防の鍵となる可能性がある。第三に、変異プロセスの時間的変化は、がん種別に腫瘍内不均一性の構造が異なることを示唆し、治療戦略の設計に影響を与える。

残された課題: 今後の検討課題として、本研究で同定された変異シグネチャの生物学的起源と、それらが癌進化の異なる段階で活性化されるメカニズムをさらに解明する必要がある。また、優勢なサブクローンの拡大を駆動する具体的なドライバー変異やエピジェネティックな変化を特定し、それらを標的とした治療法の開発が今後の研究方向性となる。本研究は、Stratton et al. Nature 2009Hanahan et al. Cell 2011といった先行研究で示された癌の複雑性をさらに深化させるものであり、Navin et al. Nature 2011が提唱する単細胞シーケンスによる進化解析の重要性を裏付けるものである。

方法

サンプルとシーケンス解析: 本研究では、ER陽性4例、HER2陽性4例、BRCA2陽性4例、トリプルネガティブ3例、BRCA1陽性5例を含む20例の原発性乳癌サンプルを、平均30〜40倍の深度で全ゲノムシーケンスした。さらに、特徴的な変異表現型を持つER陽性腫瘍1例(PD4120a)を188倍という高深度でシーケンスし、稀なサブクローナル変異の検出精度を大幅に向上させた。体細胞置換、挿入欠失、ゲノム再構成、およびコピー数変化を同定し、19例では150〜300の体細胞置換をPCRとディープパイロシーケンス(454プラットフォーム)で独立検証し、高い信頼性を確認した。また、4サンプルでは追加のエクソームシーケンスも実施し、サブクローン構造の検証に用いた。細胞株は使用せず、すべて患者由来の腫瘍組織サンプルを用いた。

Bayesian Dirichlet processによるサブクローン構造推定: 変異アレル頻度の分布をモデル化するため、新規の階層的Bayesian Dirichlet processを開発した。このモデルでは、観測された変異が未知数のサブクローン(それぞれ未知の腫瘍細胞比率と変異数を持つ)から派生すると仮定し、すべての未知パラメータを同時に推定した。ブートストラップ法を用いて、各サブクローナリティレベルでの変異検出確率を推定し、感度補正を加えた。その結果、平均して完全クローナル変異の約90%、腫瘍細胞の50%に存在する変異の約60%、25%に存在する変異の約5%を検出できることが示された。

Battenbergアルゴリズムによるサブクローナルコピー数変化の検出: 1000 Genomes Projectのデータを用いて胚細胞系列SNPを親由来ハプロタイプブロックに分類し、ハプロタイプ特異的アレル比を解析することで、染色体全体の微細なサブクローナルコピー数変化を高感度に検出するBattenbergアルゴリズムを開発した。この手法により、従来のログR値やBアレル頻度プロットでは検出困難であったサブクローナルなコピー数変化も同定可能となった。

変異タイミング解析: コピー数増加領域において、増幅前(ploidy 2)と増幅後(ploidy 1)に蓄積した変異を分離することで、染色体ゲインの相対的タイミングを分子時間軸(全点変異時間に対する割合)で推定した。これにより、大規模な染色体不安定性イベントが癌進化のどの段階で発生したかを評価した。

変異シグネチャ解析: ゲノム全体で同定された変異の塩基置換スペクトルについて、コピー数ゲイン前(early clonal)、コピー数ゲイン後(late clonal)、およびサブクローナル変異間での変化をnon-negative matrix factorization (NMF) で解析した。この解析により、5つの変異シグネチャ(A〜E)を同定し、それぞれのシグネチャが癌進化の異なる段階でどのように寄与しているかを評価した。特に、TpCコンテキストでのC>T/G変異(APOBEC関連)やCpGでのC>T変異(脱アミノ化関連)の経時的変化に注目した。統計学的解析には、変異スペクトルの比較にカイ二乗検定を用いた。