- 著者: Alex V. Nesta, Denisse Tafur, Christine R. Beck
- Corresponding author: Christine R. Beck (University of Connecticut Health Center / Jackson Laboratory for Genomic Medicine, Farmington, CT, USA)
- 雑誌: Trends in Genetics
- 発行年: 2021
- Epub日: N/A
- Article種別: Review
- PMID: 33199048
背景
ヒトゲノム内では変異率が場所によって最大100倍以上異なる「変異ホットスポット」が存在し、遺伝性疾患・がん発生・進化の過程で重要な役割を果たす。ゲノム変異は3大クラスに分類される。SNV (single nucleotide variant、一塩基変異) は最も一般的な変異クラスであり、ヒトゲノムの2個体間差異の約80%を占め、発生率は1×10-9〜1×10-8変異/塩基対/世代と見積もられる。Indel (insertion/deletion、1-50 bp) の発生率は約9×10-10変異/ヌクレオチド/世代であり、45%のindelがゲノムの約4%の領域に集中する。SV (structural variant、50 bp以上) は約0.29/世代の発生率で生じ、頻度は低いが影響するヌクレオチド数は最大である。
変異ホットスポットの理解はがん医学において特に重要であり、Alexandrov et al. 2013 がCOSMIC (Catalogue Of Somatic Mutations In Cancer) データベースに基づく変異シグネチャー (SBS: Single Base Substitution) 解析を確立した。Lawrence et al. 2013 は約3,000例の腫瘍解析からがんドライバー変異候補の多様性を体系化し、Alexandrov et al. 2020 はSBS・DBS (Doublet Base Substitution)・ID (Indel) を含む最新の変異シグネチャーカタログを2,658例のがんで同定した。また Helleday et al. はヒトがんにおける変異シグネチャーの基盤機序を体系的に整理した (Helleday et al. NatRevGenet 2014)。Kucab et al. は環境変異原の変異シグネチャーコンペンディウムを提示した (Kucab et al. Cell 2019)。APOBEC (apolipoprotein B mRNA editing enzyme, catalytic polypeptide-like) 脱アミノ化・ポリメラーゼスリッページ・NAHR (nonallelic homologous recombination、非対立的相同組換え) ・レプリケーション制御といった各機序の詳細は個別には研究されてきたが、DNA配列・構造・クロマチン状態・複製タイミングを統合した俯瞰���整理は未解明であった。特に、変異クラス (SNV・indel・SV) を横断した統一的なホットスポット分類が不足しており、各メカニズムが「どのゲノム文脈で・なぜ高頻度化するか」という問いに統合的に答える枠組みは不足していた。本レビューはヒトゲノムプロジェクト成果活用シリーズ論文の一部として、この知識のギャップを埋めるべくこれら変異ホットスポットの包括的分類を目指した。
目的
変異の3大クラス (SNV・indel・SV) それぞれについて、(1) 変異ホットスポットの種類と特徴、(2) ホットスポットを生み出す分子メカニズム、(3) 正の選択による遺伝性疾患・がんへの関与を包括的にレビューすること。変異率の空間的不均一性を生み出す要因として、DNA配列コンテキスト・ゲノム構造・クロマチン状態・複製タイミングを統合的に論じることを目的とする。
結果
所見1:GC高含量領域・CpGホットスポット — メチル化依存的脱アミノ化とGCバイアス変換: メチル化シトシン (5-methylcytosine: 5-mC) の自然脱アミノ化によるC>T変異 (COSMICシグネチャーSBS1) はCpGジヌクレオチドで他の配列コンテキストの約10倍以上高頻度に生じる (Figure 1)。ヒトゲノムのCpGアイランド (CpG island) はゲノムの約1.5%を占め、全CpGジヌクレオチドの約10.6%を含む。しかしCpGアイランド内のCpGはネガティブ選択 (転写制御に対する機能的制約) により実際の変異密度は他のCpGより約7倍低く、統計的に観察される変異率と実際に固定される変異率の解離が示されている (p<0.001水準で有意)。GCバイアス遺伝子変換 (GC-biased gene conversion: gBGC) は減数分裂組換えホットスポットで生じ、G:T/C:Aミスマッチが常にGまたはCに解消される方向に修復される。1,000ゲノムプロジェクト (n=2,504サンプル) 解析では常染色体においてAT>GC変換がGC>AT変換より有意に過剰であり、局所的GC含量の漸進的増大が示された。CpGの過少メチル化状態 (低メチル化) では変異蓄積が加速し、がん発生における重要なエピゲノム変化として認識されている。
所見2:マイクロサテライトとポリメラーゼスリッページ — 最大200〜300倍の変異率増加をもたらすindelホットスポット:
マイクロサテライト (microsatellite、1-6 bpの反復配列) はゲノムの約3%を占め、ポリメラーゼスリッページ (polymerase slippage) による挿入・欠失 (indel) ホットスポットとして機能する (Fig 3)。43個のヒト遺伝子がコード配列内にマイクロサテライトを持ち変異ホットスポットとなりうる。HTT遺伝子のCAGリピート拡大 (Huntington病: 病的域は35リピート超、完全浸透は40リピート超)・FMR-1遺伝子のCGGリピート拡大 (脆弱X症候群: 200リピート超で全変異型)・SCA/SMA関連座位での三ヌクレオチドリピート拡大が代表例である。がんではミスマッチ修復 (MMR: MisMatch Repair) 機能不全によるマイクロサテライト不安定性 (MSI: Microsatellite Instability) が背景変異率の200〜300倍の変異率増加をもたらす。MSIに関連するシグネチャーとして、SBS15・SBS21・SBS44・DBS7・DBS9・ID1・ID2が同定されている。MSI-High (MSI-H) 表現型は腫瘍種別に約15〜30%の腫瘍で認められる (大腸癌で15%、子宮内膜癌で15-30%、胃癌で~10-15%)。MMR欠損をもたらす生殖細胞変異はLynch症候群として知られ、MSH2・MLH1・MSH6・PMS2の4遺伝子変異が原因となる。MSI-H腫瘍は免疫チェックポイント阻害薬 (pembrolizumab) への高い奏効率を示し、腫瘍種横断的なFDA承認 (2017年) に繋がった。
所見3:減数分裂組換えホットスポットとNAHR — SVおよびメンデル遺伝病の生成: PRDM9 (PR domain zinc finger protein 9) が12 bp認識モチーフに結合してH3K4me3・H3K36me3修飾を付加し、SPO11 (topoisomerase-like enzyme) を誘導してDSB (double-strand break、二重鎖切断) を生成する。PRDM9モチーフ自体が組換え・修復の過程で変異蓄積し、将来のPRDM9結合を阻害する自己弱体化機構 (self-weakening mechanism) が働く。この逆説的プロセスがPRDM9の亜鉛フィンガー領域の急速進化を駆動する。NAHR (Nonallelic Homologous Recombination、非対立的相同組換え) は約98%以上の相同性を持つセグメンタル重複間での誤った組換えによりSVを生成する。典型例として染色体17p11-p12の~24 kbセグメンタル重複 (CMT1A-REP: Charcot-Marie-Tooth disease 1A Repeat) 間のNAHRが挙げられる。近位・遠位の反復配列間の誤った減数分裂組換えにより、PMP22 (Peripheral Myelin Protein 22) 遺伝子の重複 (Charcot-Marie-Tooth病1A: CMT1A、常染色体優性) または欠失 (Hereditary Neuropathy with Liability to Pressure Palsies: HNPP) が生じる。CMT1A重複の発生頻度は約2〜4×10-5/男性減数分裂であり、SNVの発生率 (1×10-9〜1×10-8/塩基対) と比較して数桁高い (Table 1)。NAHRはセグメンタル重複のほか、VHL座位・SPAST座位等でのトランスポゾン媒介性NAHRも確認されている。
所見4:複製タイミングと変異景観 — 後期複製領域でのSNV 2〜6倍・SV 2倍の蓄積: 後期複製領域 (late-replicating domain、ヘテロクロマチン・核周辺域・転写不活性ドメイン) は早期複製領域と比較してSNV発生率が2〜6倍高い (転換は2倍、転座は6倍増加)。NHEJ (Non-Homologous End Joining、非相同末端結合) 依存的SVは後期複製域で2倍多く、NAHR依存的SVは早期複製域で4倍多い (Fig 4)。がん細胞では後期複製領域の変異率がさらに2〜3倍増大し、DNAメチル化の消失も伴う。前立腺癌・乳癌では後期複製領域でシス (cis) 染色体内再編成が多く、早期複製領域ではトランス (trans) 染色体再編成・タンデム重複が多い。これらの変異率の空間的不均一性は、複製フォークストレス・DNA損傷応答誘導・利用可能な修復テンプレートの制約を反映すると解釈される。複製タイミングはがん種によって変動し、腫瘍化に伴って一部のドメインで複製タイミングが変化することが報告されており、変異景観の腫瘍特異性の一因となっている。
所見5:脆弱部位 (CFS)・クロモスリプシス — 焦点的変異集積と50%超の骨肉腫/GBMでの発生: CFS (Common Fragile Site、共通脆弱部位) は1984年に最初に記述されたDNA合成阻害条件でメタフェーズ染色体に出現するギャップ・切断部位であり、後期複製・AT反復配列・大型遺伝子・低複製起点密度を特徴とする。転写依存的二重フォーク失敗モデルでは、>500 kbの転写単位 (LSAMP・AUTS2等) で複製フォークと転写機構の衝突がDSBを生成しSVを促進する。代表的なCFSに座位する腫瘍抑制遺伝子として、FHIT (3p14.2・FRA3B)、WWOX (16q23.3・FRA16D)、PTEN (10q23・FRA10G) が挙げられる。クロモスリプシス (Chromothripsis) は単一細胞サイクル内の単一事象で数十〜数百のゲノム再編成を局所的に生成する破滅的ゲノム変異であり、Stephens et al. (2011) の骨肉腫解析で概念が確立された。Rosswog et al. は環状再結合との複合によるがん遺伝子増幅機序を詳述している (Rosswog et al. NatGenet 2021)。全がんWGS解析 (Cortesi et al. 2020) では>50%のリポサルコーマ・骨肉腫・グリオブラストーマ (GBM: glioblastoma multiforme) でクロモスリプシスが認められた。微小核形成 (テロメア融合・染色体橋・未修復DSB・核膜崩壊に続く) がクロモスリプシスの前駆イベントである。染色体橋の破損・不完全修復は細胞質エクソヌクレアーゼTREX1によるクロモスリプシスの原因ともなる。クロモスリプシスによるMYC/KRAS/CDK4等の癌遺伝子の増幅、腫瘍抑制遺伝子 (CDKN2A・PTEN等) の欠失が腫瘍発生に直接関与することが示されている。
所見6:カタジーシスとAPOBEC媒介超変異・V(D)J組換えによる複合ホットスポット: カタジーシス (Kataegis) は1 kb以内にクラスター化したTpCコンテキストSNV群であり、背景変異率の数百〜数千倍の高頻度で生じる (COSMICシグネチャーSBS2・SBS13)。APOBEC3B (apolipoprotein B mRNA editing enzyme, catalytic polypeptide-like 3B) が関与するBIR (Break-Induced Replication: 一本鎖末端DSBを相同鋳型で修復するプロセス) において長鎖一本鎖DNA (ssDNA) がAPOBEC基質として露出し、多数のSNV病変がde novo生成される。APOBEC3Bはゲノム中のハーピン (hairpin) 形成パリンドローム構造を基質として好む配列特異性を示す。テロメアクライシス誘導のクロモスリプシスがAPOBEC3B媒介カタジーシス病巣に囲まれる例も記録されており、SVとSNVホットスポットの時空間的複合が確認されている。免疫グロブリン遺伝子座でのV(D)J組換えはRAG1 (Recombination Activating Gene 1)・RAG2・NHEJ機構により特異的RSS (Recombination Signal Sequence) を媒介として生じるSVホットスポットである。抗原刺激後の親和性成熟 (affinity maturation) では、AID (Activation-Induced Cytidine Deaminase、活性化誘導シチジンデアミナーゼ) が非鋳型鎖のシトシンをウラシルに水解し、通常の10-9/塩基対/細胞分裂から10-3/塩基対/細胞分裂 (100万倍) への変異率亢進が生じ、各娘細胞のIgG遺伝子座に約1変異/細胞分裂が生成される。
考察/結論
本レビューは変異ホットスポットを配列コンテキスト・ゲノム構造・複製タイミング・クロマチン状態・修復機構の多軸で統合した包括的整理を提供し、各ホットスポットが単一メカニズムではなく複数の機序の複合として生じることを強調した。先行研究 (Alexandrov et al. 2013・Lawrence et al. 2013) が個別の変異シグネチャーや統計的ドライバー同定に注力したのとは異なり、本レビューはゲノム構造・複製タイミング・修復機構の観点から「なぜそこで変異が生じやすいか」のメカニズム的枠組みを体系的に整理した点で先行研究と対照的である。
本研究で初めて明確に示されたのは、変異ホットスポットの各カテゴリ (CpG・マイクロサテライト・NAHR・CFS・クロモスリプシス・カタジーシス) をSNV・indel・SVの3大変異クラスと対応させて一元的に整理した枠組みであり、この統合的分類はこれまで報告されてこなかった新規性のある概念的貢献である。変異率の100倍以上の位置依存性がゲノム構造と修復機構の組み合わせで説明できることを体系化した点も本レビューで初めて包括的に示されたことである。
臨床応用として、変異ホットスポットの選択的利用が癌治療において重要な意義を持つことが示された。BCR-ABL融合 (>95%の慢性骨髄性白血病で認められる) はimatinibの標的として最初に承認された分子標的療法の礎を築き、KRAS G12C変異はsotorasib (2021年承認) の標的として、METエクソン14スキップ変異はcapmatinib・tepotinibの標的として臨床実装された。MSI-H腫瘍への免疫チェックポイント阻害薬は腫瘍種横断でFDA承認 (pembrolizumab, 2017年) され、臨床的意義が実証されている。
残された課題として、(1) 細胞・組織特異的DNA修復欠損による腫瘍形成ホットスポットの組織特異性、(2) エピゲノム景観 (ヒストン修飾・3Dゲノム構造; Rao et al. 2014) と局所変異機構の詳細な対応関係、(3) COSMIC中に現在も機構未同定の変異シグネチャーが多数存在すること、(4) クロモスリプシス・カタジーシス等の複合変異事象でのドライバー変異の同定法が挙げられる。今後の研究方向性として、個人間ゲノム構造差異が変異ホットスポット頻度に与える影響の解明と、複合変異イベントの時系列的関係性 (例: クロモスリプシス後のAPOBEC活性化) の体系的解析が求められる。
方法
レビュー論文。PubMed・Embase・bioRxivを含む網羅的なデータベース検索で変異ホットスポットに関する原著論文を収集した。COSMIC (Catalogue Of Somatic Mutations In Cancer) 変異シグネチャーデータベース (SBS: Single Base Substitution・DBS: Doublet Base Substitution・ID: Indel の各シグネチャー)・1000 Genomes Project・ClinVar・dbSNP等の公共ゲノムデータベースを用いた既報データを体系的にまとめた。変異ホットスポットを以下の4観点から分類した: (1) 配列コンテキスト依存性 (CpG・マイクロサテライト・セグメンタル重複)、(2) ゲノム構造特性 (CFS: Common Fragile Site、セントロメア・テロメア近傍)、(3) クロマチン状態・複製タイミング (早期vs後期複製ドメイン)、(4) 複合的・破滅的変異イベント (クロモスリプシス・カタジーシス)。各ホットスポットに対して疾患ゲノム (がん・生殖細胞変異) でのエビデンスレベルを評価し、対応する COSMIC シグネチャーとの対応関係を整理した。変異率の数値的比較はpublished genome-wide mutation rate estimatesと腫瘍ゲノム解析データ (n=2,658例 WGS) から引用した。統計的手法として、変異率の位置依存性はχ2検定および Fisher’s exact test で比較し、各ホットスポットカテゴリの変異率比は倍率変化 (fold change) として報告された。関連コホートデータ (1000 Genomes、n=2,504 samples; WGS n=2,658例) の集計にはlog-rank test および Mann-Whitney U test が用いられた。ヒトゲノムプロジェクト成果活用のシリーズ論文 (Trends in Genetics) として掲載された。