• 著者: Carolina Rosswog, Christoph Bartenhagen, Anne Welte, et al.
  • Corresponding author: Martin Peifer / Matthias Fischer (University of Cologne)
  • 雑誌: Nature Genetics
  • 発行年: 2021
  • Epub日: 2021-11-15
  • Article種別: Original Article
  • PMID: 34782764

背景

がんゲノムにおけるコピー数増幅は、癌原遺伝子の過剰発現を通じて悪性形質転換を駆動する主要なメカニズムである。増幅の形態として、セントロメアを持たない環状染色体外DNA (double minutes: DM) と染色体内の均一染色領域 (homogeneously staining regions: HSR)、さらに巨大マーカー染色体 (neochromosome: NC) が知られている。神経芽腫ではMYCN増幅が全症例の20%に認められ、そのうち93%はDMとして、6%はHSRとして出現する。これらの増幅は、がんの悪性度や治療抵抗性と関連することが知られているが、その複雑な形成メカニズムは依然として未解明な部分が多い。

複雑なゲノム再編成の一形態であるchromothripsisは、染色体の急性大規模破砕と無秩序な再連結による現象であり、振動するコピー数変化と多数の再編成を特徴とするが、それ単独では高度増幅を引き起こさないことが示されていた。一方、細胞外DNA (extrachromosomal DNA: ecDNA) 形成によるがん遺伝子増幅の広汎な存在が複数のがん種で報告されており、特にTurner et al. Nature 2017Wu et al. Nature 2019の研究でその重要性が強調されている。しかし、chromothripsisとecDNA形成、およびその後の増幅を連鎖する機序の体系的解明は不足していた。従来の増幅モデル (breakage-fusion-bridge: BFB サイクル、タンデム重複など) では、観察されるような高度かつ不連続なコピー数プロファイルを説明しきれず、新たなメカニズムの特定が課題であった。特に、Verhaak et al. NatRevCancer 2019が指摘するように、染色体外DNAの進化経路は多様であり、その詳細な解明が求められていた。また、Cortes et al. NatGenet 2020Kim et al. NatGenet 2020などの研究は個々の現象に焦点を当てていたが、両者の連続的な関係性については包括的な理解が不足していた。本研究は、この知識のギャップを埋めることを目指した。

目的

本研究の目的は、神経芽腫の全ゲノムシークエンシングデータから見出した複雑増幅型を「seismic amplification」として定義し、そのゲノム構造の特徴と進化モデルを確立することである。さらに、ICGC/TCGA PCAWG (Pan-Cancer Analysis of Whole Genomes) コホートの38がん種でその頻度、がん種分布、およびがん遺伝子発現への影響を定量的に評価する。最終的に、chromothripsis後の円環組換えを中心とする進化モデルをin silicoシミュレーションで検証し、seismic amplificationの発生メカニズムを分子レベルで解明することを目指す。本研究は、seismic amplificationがDM、HSR、NCといった異なる細胞遺伝学的状態をとりうることを考慮し、これらの多様な形態が共通の進化経路を共有する可能性を検証することも目的とする。

結果

Seismic amplificationの定義と神経芽腫での頻度: 神経芽腫79例のうち増幅を有する57例を解析し、20種のアンプリコン (57例中19例) がseismic amplificationの基準 (内部再編成数 ≥14) を満たした。これらは2つのホットスポット領域、染色体2p24 (10例、MYCN遺伝子座) と染色体12q13/12q15 (14例、CDK4/MDM2遺伝子座) を主に含み、4例では2p・12qが同一seismicアンプリコン内に共増幅されていた (Fig. 1a, Extended Data Fig. 1)。細胞遺伝学的にDM・HSR・NCの3形態を示し、optical mappingで過去に再編成されたゲノム断片の重複がseismic増幅の組換え機序を支持した (Fig. 2g)。神経芽腫細胞株TR-14では染色体2pと12qの領域が同一DM上で増幅され、NGP細胞株では染色体4と12にそれぞれ統合されたHSRとして存在した。

Pan-cancer解析における頻度と特性 (PCAWG, n=2,677): PCAWG 2,677腫瘍のうちCN ≥5の増幅が1,404例 (52.4%) に認められ、そのうちseismic amplificationは255例 (9.5%、284アンプリコン) で検出された。Seismic amplificationに関連した再編成の95% (21,923/23,077件) は従来の解析で「complex, unclassified」に分類されており、seismic amplificationが独立した構造変異カテゴリを形成することが裏付けられた。頻度はサルコーマ・高悪性度脳腫瘍・一部の癌腫で最高で、白血病・リンパ腫・良性腫瘍ではほぼ欠如していた (Fig. 3a)。Seismic amplificationはその他の増幅型と比較して内部再編成数、ゲノムセグメント数、CN状態数、最大CN、ゲノム影響領域のすべてで有意に大きかった (各P <0.001〜P = 2.663×10^-290; Fig. 3b)。

がん遺伝子発現への影響: 1,188例のRNA発現データで評価したところ、seismic amplification下でのがん遺伝子発現はその他の増幅形式と比較して有意に高く、FGFR1 (P = 4.072×10^-3)、CCND1 (P = 1.946×10^-7)、CDK4 (P = 1.201×10^-17)、MDM2 (P = 5.554×10^-16)、ERBB2 (P = 3.66×10^-17)、AKT2 (P = 1.067×10^-4) が有意な過発現を示した (Fig. 3d)。これは高コピー数に由来する実機能的な遺伝子過発現であることが確認された。

Chromothripsisとの関連: Seismic amplificationを有する腫瘍の89.1% (244 of 274 cases) にchromothripsisが認められた一方、seismic amplificationを持たない腫瘍でのchromothripsis頻度は有意に低く (P <0.001)、独立した発生には帰せられないことが示された (Fig. 4a)。Seismic増幅アンプリコンの77.6%がchromothripsis領域と少なくとも部分的に重複し、34.9%は完全に重複していた (Fig. 4b)。これらのデータはchromothripsisがseismic amplification進化の必須ステップであることを支持する。

BFBではなく円環組換えが主要メカニズム: BFB (breakage-fusion-bridge) の指標であるfoldback inversions (FBR) がseismic amplificationに存在するのは2.3% (7 of 304) のみで、その他の増幅型でのBFB頻度16% (1,420 of 9,051) と対照的だった (Extended Data Fig. 6c)。flanking再編成のread supportは内部再編成の6倍以上 (>6x) であり、flanking再編成が内部再編成より時間的に早期に生じたことを示した (Fig. 5b)。染色体への組み込みを示す再編成のread supportは低く、染色体統合が後期イベントであることを裏付けた。24,300例のシミュレーション解析 (3シナリオ×多パラメータ×100反復) では、seismic amplificationのCNシグネチャーはシナリオ3 (chromothripsis後円環組換え) に最も高い適合度を示し、Hellinger距離で上位5シミュレーションがすべてシナリオ3 (2重クロスオーバー75〜90%) であった (Supplementary Table 4)。シミュレーションで約50〜60回の円環組換えサイクル後にプロファイルが腫瘍例と一致する安定状態へ到達することも示された (Extended Data Fig. 10a,b)。

APOBEC変異とkataegisの濃縮: APOBECシグネチャー (SBS2・SBS13・DBS11) はseismic amplificationを有する症例で有意に濃縮されていた (各P <0.001)。Kataegis (過変異クラスター) の保有率はseismic amplification症例で91%、chromothripsis単独例で71%、両者非保有例で53%と段階的に高く (各P <0.001; Extended Data Fig. 9b)、Seismic領域でのkataegis密度は非seismic chromothripsis領域の12.5倍 (中央値0.5 vs 0.04 clusters per megabase)、非chromothripsis領域の250倍 (vs 0.002 clusters per megabase) だった (P <0.001; Fig. 8b)。Kataegis変異のallelic frequencyは1に近く (Extended Data Fig. 9c)、過変異は増幅アレル上で早期に生じたことを示唆した。また全kataegisフォーカスの47%がseismic再編成ブレークポイントから1 kb以内に位置していた (Extended Data Fig. 9d)。

Seismic amplificationの時間的安定性: 神経芽腫4例 (診断〜再発間隔330〜649日、7〜11サイクルの多剤化学療法後) でCN・再編成プロファイルは診断時と再発時でほぼ同一だった (Fig. 8c-f)。脂肪肉腫細胞株ペア (同一患者の診断時・再発時由来) においてもNCとしてのseismic amplificationは安定していた (Fig. 8g)。PCAWG解析では2p24 (DM/HSR) 75%・12q (DM/HSR) 74%がpotential DM/HSR、26% (78 of 304 amplicons) がpotential NCに分類された。この安定性は、DNA円環の集団における birth-death モデルを用いたシミュレーションで、約50〜60組換えサイクル後に動的平衡に達することで説明された (Extended Data Fig. 10a,b)。

考察/結論

本研究は「seismic amplification」という複雑増幅の新しいカテゴリーを定義し、その進化機序としてchromothripsis→DNA断片の円環化→反復的な円環組換えという段階的プロセスを確立した。このモデルは24,300件のin silicoシミュレーションと実際の腫瘍ゲノムデータの詳細な照合により強く支持される。従来の増幅メカニズム (BFBサイクル、タンデム重複) に加え、円環組換えが第三の主要経路として位置づけられたことは、がんゲノム学の根本的理解を刷新するものである。

先行研究との違い: 先行研究はchromothripsisとecDNAをそれぞれ独立した異常として解析してきたが、本研究は両者が連続した生物学的プロセスを形成することを38がん種のコホートで初めて大規模実証した。これはCortes et al. NatGenet 2020Kim et al. NatGenet 2020といった研究が個々の現象に焦点を当てていたと異なり、より統合的な視点を提供した。神経芽腫でのecDNA起源としてのchromothripsisの関与 (Koche et al., 2020; Shoshani et al., 2021) を普遍化したのみならず、DM・HSR・NCという異なる細胞遺伝学的状態が共通の円環組換え経路から派生する可能性を提示した。従来「unstable」と見なされたDMが実際には診断〜再発間で安定した増幅プロファイルを維持することも示され、動力学モデルで約50〜60組換えサイクルで動的平衡に達することで説明された。

新規性: 本研究で初めて、seismic amplificationという複雑な増幅パターンを定義し、その発生メカニズムとしてchromothripsisに続く円環組換えが主要な役割を果たすことを新規に示した。このメカニズムは、これまで報告されていない複雑なゲノム再編成の進化経路を明らかにするものであり、がん遺伝子増幅の理解を深める上で極めて重要な新規知見である。

臨床応用: 臨床的観点からは、seismic amplificationを伴う腫瘍では従来増幅より著しく高い癌遺伝子発現 (FGFR1・CDK4・MDM2・ERBB2・AKT2で各P <10^-4 〜10^-17) が確認されており、これらがん遺伝子に対する標的治療の感受性予測バイオマーカーとしての臨床応用が期待される。また、高いAPOBEC変異・kataegis頻度 (seismic領域でkataegis密度0.5 clusters per megabase) は、Alexandrov et al. Nature 2013Alexandrov et al. Nature 2020が報告したAPOBEC関連変異シグネチャーを治療選択の参照として用いる新たな枠組みを臨床現場にもたらす可能性を秘めている。

残された課題: 今後の検討課題として、seismic amplificationが生じる細胞生物学的条件 (DNA修復経路の欠損、細胞分裂制御異常) の詳細な解明、円環組換えの開始・終結トリガーの実験的同定、および各がん種での独立した予後・治療応答予測能の定量的評価が残されている。また、本研究のseismic amplificationの定義はWGSデータと特定のアルゴリズムに依存しており、異なるシーケンス技術や解析手法を用いた場合の閾値の再較正も今後の研究で必要となるlimitationである。

方法

神経芽腫79例の全ゲノムシークエンシング (WGS) データを起点として複雑増幅アンプリコンを同定した。seismic amplificationの定義として「内部再編成が14個以上」のカットオフを設定し (ROC解析で感度・特異度のバランスを最適化)、FISH (蛍光in situ ハイブリダイゼーション)・optical mappingで細胞遺伝学的状態を確認した。optical mappingではBionano Irys genome mapping systemを使用し、contigのアセンブリとハプロタイピングを行った。神経芽腫細胞株としてTR-14、NGP、LS、CLB-GA、GI-M-EN、Lan-6、SK-N-FIの7株、および脂肪肉腫細胞株93T449と94T778の2株を用いた。

汎がん種解析には ICGC/TCGA PCAWGコンソーシアムの2,677腫瘍・37がん種のWGSデータを使用した。再編成の検出にはSoReCa (v.0.6.2) を用い、PCAWGコホートではDELLY、SnowmanSV、BRASS、dRangerの4アルゴリズムのコンセンサスコールを適用した。コピー数 (CN) 解析はSclust (v.1.2) を用いて行い、ploidyとpurityを推定した。BFB (breakage-fusion-bridge) 残遺の検出にはfoldback inversion (FBR) 頻度 (>25%をBFB領域と定義) を用いた。円環組換えモデルの検証として24,300件のin silicoシミュレーション (3シナリオ×多パラメータ×100反復) を実施し、Hellinger距離でシナリオ適合度を評価した。シミュレーションでは、chromothripsis後のBFB、BFB後のchromothripsis、chromothripsis後の円環組換えの3つのシナリオを比較した。

変異シグネチャー解析ではAPOBECシグネチャー (SBS2・SBS13・DBS11) の濃縮をFisher’s exact testで検定し、kataegis (過変異クラスター) の分布を評価した。RNA発現データはPCAWGのTophat FPKM値を使用し、Wilcoxon rank-sum testで遺伝子発現レベルを比較した。4症例の神経芽腫および脂肪肉腫細胞株ペアで診断時・再発時のCN/再編成プロファイルを比較し、seismic amplificationの時間的安定性を評価した。統計解析はR (v.3.5.1) を用いて行い、多重検定補正にはBenjamini-Hochberg法を適用した。