- 著者: Armande Ang Houle, Heather Gibling, Fabien C. Lamaze, Hilary A. Edgington, David Soave, Philip Awadalla, et al.
- Corresponding author: Philip Awadalla (Ontario Institute for Cancer Research)
- 雑誌: Genome Research
- 発行年: 2018
- Epub日: N/A
- Article種別: Original Article
- PMID: 30341163
背景
PRDM9 (PR/SET domain 9) は、減数分裂において相同染色体間の組換えホットスポットにDNA二本鎖切断 (DSB) を誘導する重要な因子であり、通常は生殖細胞のみで発現する。PRDM9の機能ドメインには、タンパク質間相互作用を媒介するKRAB (Krüppel-associated box) ドメイン、H3K4me3およびH3K36me3活性を提供するPR/SETドメイン、そして特定のDNAモチーフを認識してDSBおよび減数分裂組換え機構をリクルートするDNA結合亜鉛フィンガー (ZnF) アレイドメインが含まれる。PRDM9はZnFドメインが認識する特定のモチーフを持つ部位にエピジェネティックマークを付与し、DSBおよび減数分裂組換え機構のリクルートを誘導する (Smagulova et al. 2011; Brick et al. 2012; Pratto et al. 2014)。PRDM9の発現と関連するエピジェネティックマークは、減数分裂のパキテン期に消失することから、その生物学的機能は配偶子形成組織に限定されると考えられてきた (Sun et al. 2015)。
体細胞におけるDSBは、通常、相同組換え修復 (HR) 経路によって保守的に修復されるが (Andersen and Sekelsky 2010; Symington et al. 2014; Lisby and Rothstein 2016)、修復不全は非特異的修復メカニズムを介して転座、逆位、欠失などの構造異常を招く可能性がある (Jackson 2002)。体細胞構造変異 (SV) の高頻度な発生は、癌の主要な特徴の一つであるゲノム不安定性を示す (Hanahan and Weinberg 2011)。DSB修復 (DSBR) 欠損は、相同組換え修復経路に関与する遺伝子の生殖系列および体細胞性機能喪失 (LOF) 変異と関連する変異シグネチャの根底にある (Moynahan and Jasin 2010; Krejci et al. 2012; Lord and Ashworth 2016; Alexandrov et al. Nature 2013)。しかし、一部の癌では、既知の相同組換え修復経路の調節因子に検出可能なLOF変異がないにもかかわらず、DSBR欠損の変異シグネチャを示すことが報告されており (Connor et al. 2017)、ゲノム不安定性の根本原因を理解することの重要性が示唆されている。
PRDM9の発現は以前に一部の卵巣癌および肺腺癌細胞株で報告されていたが (Feichtinger et al. 2012)、in vivoでの癌横断的な発現状況と、それが癌のトランスクリプトームおよびゲノムランドスケープに与える影響については、包括的な解析が不足していた。特に、PRDM9の異常発現が癌におけるゲノム不安定性にどのように寄与するのかというメカニズムは未解明であった。
目的
本研究の目的は、PCAWG (Pan-Cancer Analysis of Whole Genomes) およびTCGA (The Cancer Genome Atlas) コホートのデータを用い、39種の癌型1,879検体におけるPRDM9の発現状況を詳細に調査することである。さらに、PRDM9の異常発現が癌のゲノムおよびトランスクリプトームランドスケープに与える影響、特に構造変異のパターン、遺伝子発現の変化、および体細胞変異との関連を包括的に評価し、PRDM9が癌の生物学において果たす可能性のある役割を解明することを目指す。具体的には、PRDM9発現腫瘍における構造変異ブレークポイントのPRDM9結合モチーフへの集積、および既知の減数分裂PRDM9活性部位での構造変異の濃縮を検証し、PRDM9の異常発現が癌におけるゲノム不安定性に関連する新たなメカニズムであるという仮説をin vivoで検証することを目的とする。
結果
PRDM9の異常発現の頻度と癌種分布: PRDM9は、39癌種1,879検体中365検体 (約20%) で発現を認め、32癌種に分布した (Fig. 1A)。頭頸部扁平上皮癌 (中央値153.84 FPKM-UQ) および膀胱尿路上皮癌 (95.41 FPKM-UQ) が最高発現を示した。肝癌の46%、卵巣癌の44%で10 FPKM-UQ以上の発現が認められた。腫瘍でのPRDM9発現はマッチ正常組織(n=128ペア)より有意に高く (一側Wilcoxon符号順位検定: p<2.2×10⁻¹⁶)、GTExの非生殖健常組織と比べても発現陽性比率が有意に高かった (一側二標本比率等価検定: p<2.2×10⁻¹⁶) (Fig. 1B, C)。これらの結果は、PRDM9が多くの癌で転写活性化されることを示している。
PRDM9発現と関連する転写プログラムの変化: PRDM9発現腫瘍と非発現腫瘍間で差次的遺伝子発現解析 (DGE) を行った結果、3,114遺伝子が差次的発現を示した (FDR<1%) (Fig. 2A)。このうち2,224遺伝子が発現上昇、890遺伝子が発現低下していた。差次的発現遺伝子には、IntOGenリソースで同定された22個の既知癌ドライバー遺伝子が含まれていた。また、減数分裂関連遺伝子13個 (REC8, M1APなど) の上方制御が認められた。特に、コヒーシン複合体の減数分裂特異的メンバーをコードするREC8遺伝子や、減数分裂プロセスの調整に寄与するとされるM1AP遺伝子の発現上昇が確認された。PRDM9発現と関連する差次的発現遺伝子のパンキャンサー高相互作用モジュールでは、細胞分化、Gタンパク質シグナル伝達、ヌクレオソームアセンブリに関わるGene Ontology (GO) 生物学的プロセスが濃縮されており、精巣特異的発現遺伝子のモジュールで濃縮されるプロセスと類似していた。これは、精巣とPRDM9発現癌の間で共通の生物学的プロセスが存在する可能性を示唆する。さらに、性別を共変量としてDGE解析を行った場合、1,178遺伝子が差次的発現を示し (FDR<1%)、この中には精巣特異的遺伝子 (TEX41, TSKS, BRDT, TSGA10IP) や減数分裂特異的遺伝子 (DMC1, EME1) が含まれていた。これらの遺伝子のlog2 fold changeは平均で1.8倍であった。
PRDM9遺伝子座近傍の反復変異領域とPRDM9発現の関連: 体細胞変異の解析では、PRDM9遺伝子座 (Chr5) の5 Mb以内に位置する8か所の反復変異領域がPRDM9発現と有意に関連した (Bonferroni補正後p<0.05) (Fig. 2B)。これらの領域に近接するいくつかの遺伝子 (CTD2074D8.1, RP11-730N24.1, RP11-560A7.1, RP11-42L13.3) は、GTExコンソーシアムのデータで精巣特異的発現を示すことが確認された。これは、これらの体細胞変異が、PRDM9を含む精巣および減数分裂特異的機能に関連するトポロジカル関連ドメイン全体の抑制を破壊する可能性を示唆している。
SVブレークポイントのPRDM9結合モチーフへの集積: SVブレークポイント解析では、PRDM9発現陽性腫瘍において、SVブレークポイント配列 (SVBS) がPRDM9 A-variant結合モチーフと有意に一致する割合が高かった (vs ZNF263モチーフ: Wilcoxon符号順位検定 p=2.38×10⁻⁷) (Fig. 3A)。この割合は、PRDM9非発現腫瘍と比較して有意に高率であった (χ²検定: p=2.2×10⁻¹⁶)。PRDM9発現陽性腫瘍のSVBSに濃縮された識別モチーフを特定する判別モチーフ探索も行われ、PRDM9結合モチーフと部分的に一致するモチーフが同定された。この濃縮モチーフを含むSVBSの27%が、完全なPRDM9結合モチーフとも一致した (FDR<1%)。
PRDM9特異的H3K4me3領域でのSV集積: PRDM9発現腫瘍では、既知のPRDM9活性部位である高組換え率領域 (HRR) におけるSVブレークポイントの有意な濃縮が観察された (Fig. 3B)。特に、脳膠芽腫、腎細胞癌、頭頸部扁平上皮癌、肝細胞癌、乳癌において、PRDM9発現とSVブレークポイントのHRRへの共局在に有意な関連が認められた。さらに、PRDM9特異的H3K4me3マーク領域においても、PRDM9発現腫瘍でSVブレークポイントの有意な濃縮が確認された (OR=1.12, 95% CI 1.05-1.19, p=4.7×10⁻⁴)。AluおよびTHE1リピート要素を除外した後も同様の結果が観察され、この傾向は全てのSVクラスで認められた。これらの知見は、PRDM9が介する減数分裂組換え部位とPRDM9発現癌におけるSVの位置との間にin vivoでの関連があることを示している。一方で、卵巣癌、肺扁平上皮癌、子宮体癌では、PRDM9発現腫瘍において減数分裂HRRでのSVがわずかではあるが有意に減少する逆の効果が観察された (OR<1)。これらの癌種では、相同組換え修復経路のLOF変異の変異シグネチャが濃縮されており、非相同DSBR機構によるDSBRの増加が示唆される。このHRRにおけるSVの枯渇は、PRDM9とは無関係なDSBが増加している可能性を示唆している。
考察/結論
本研究は、減数分裂特異的遺伝子PRDM9の異常発現が多様な癌種で認められ、そのPRDM9結合モチーフ近傍への構造変異ブレークポイントの集積を通じてゲノム不安定性に寄与することを、in vivoで初めて大規模に示した。
先行研究との違い: これまでの研究では、一部の癌細胞株や限られた癌検体でのPRDM9発現が報告されていたが (Feichtinger et al. 2012)、本研究は32種の癌型にわたる1,879検体という大規模コホートを用いて、PRDM9の異常発現が癌において広く認められる現象であることを実証した点で、これまでの報告と対照的である。また、先行研究 (Hussin et al. 2013; Woodward et al. 2014) が減数分裂組換えサイトと体細胞SVの相関を示唆していたものの、本研究は実際のPRDM9発現とゲノム異常のin vivoでの直接的な関連を大規模に実証した点が独自性である。
新規性: 本研究で初めて、PRDM9が非生殖細胞で異常発現することで、減数分裂型のDSBが異所的に誘導され、その後の非特異的修復経路を介して構造変異が蓄積するという、癌におけるゲノム不安定性の新規なメカニズムをin vivoで提唱した。PRDM9結合モチーフへのSVブレークポイントの有意な集積、およびPRDM9特異的H3K4me3領域でのSV濃縮は、PRDM9の異常なエピジェネティック活性が体細胞ゲノムに直接的な影響を与えることを初めて報告するものである。
臨床応用: 本知見は、PRDM9の異常発現が癌におけるゲノム不安定性の新規バイオマーカーとなりうる可能性を示唆しており、将来的に癌の診断や予後予測における臨床応用が期待される。また、PRDM9の異常な活性を標的とした治療戦略の開発につながる可能性も秘めている。例えば、PRDM9のDSB誘導活性を阻害することで、ゲノム不安定性を抑制し、腫瘍の進行を遅らせるアプローチが考えられる。
残された課題: PRDM9の癌における役割がゲノム不安定性のドライバーであるのか、あるいはパッセンジャー変異であるのかは残された課題である。PRDM9発現とSVブレークポイントの関連が非線形であること、すなわちPRDM9発現が最も高い癌種がSV集積も最も高いわけではないという観察は、PRDM9関連SVが修復経路の上方制御によってバランスされている可能性を示唆しており、今後の詳細な機能解析が求められる。また、卵巣癌や子宮体癌で観察された減数分裂HRRでのSV低下は、HR修復欠損と非相同末端結合 (NHEJ) 優位という別のメカニズムの関与を示唆しており、これらの癌種におけるPRDM9の役割はさらに複雑であると考えられる。PRDM9の結合部位がアレルに依存して変化することから、Aアレル頻度が低い集団におけるPRDM9発現癌のSV位置のシフトを調査することは、SV生成メカニズムの理解を深める上で今後の方向性となる。
方法
本研究では、PCAWGおよびTCGAコホートから合計1,879検体(39癌種)のRNA-seqデータおよび全ゲノムシーケンシングデータが解析された。PRDM9と高相同性を持つパラログPRDM7の影響を補正するため、PRDM9のZnFアレイ領域(hg19; Chr 5: 23,526,838 - 23,528,706)に特異的にマッピングされるリードのみをPRDM9の発現量としてカウントするバイオインフォマティクスパイプラインを構築した。この相同性補正により、PRDM9の発現量が10 FPKM-UQ (fragments per kilobase of transcript per million mapped reads-upper quartile) を超える246検体が偽陽性として除外された。RNA-seqデータはSTAR (Dobin et al. Bioinformatics 2013)でアラインメントされ、HTSeq (Anders et al. Bioinformatics 2015)で遺伝子発現量が定量化され、FPKM-UQ値として正規化された。
PRDM9発現の比較では、腫瘍とマッチ正常組織(128ペア)およびGTEx健常組織データベースとの間で、一側Wilcoxon符号順位検定を用いて有意差を評価した (p<2.2×10⁻¹⁶)。差次的遺伝子発現解析 (DGE) はDESeq2 (Love et al. GenomeBiol 2014)を用いて実施され、PRDM9発現腫瘍と非発現腫瘍間で遺伝子発現を比較し、FDR<1%およびlog2 fold change >2を基準に有意な遺伝子を同定した。PCAWGプロジェクトコードを共変量として含め、組織およびコホート特異的発現差を補正した。
体細胞変異の解析では、100 bp以内に2つ以上のSNVが集積する1,507,106箇所の反復変異領域を特定し、そのうち5%以上の検体で変異が認められる5,548領域について、PRDM9発現との関連を線形回帰モデルで検定し、Bonferroni補正後のp<0.05を有意とした。
構造変異 (SV) ブレークポイント解析には、PCAWG-6グループによって同定されたコンセンサスSVデータを用いた。SVブレークポイント配列 (SVBS) 中のPRDM9 A-variant結合モチーフ (Pratto et al. 2014) の過剰代表性を評価するため、SVブレークポイントから100 bpのフランキング配列を抽出し、JASPARデータベースの転写因子結合モチーフと比較した。PRDM9 A-variant結合モチーフのSVBSへのマッチング頻度を、他のモチーフ(例: ZNF263)と比較し、Wilcoxon符号順位検定 (p=2.38×10⁻⁷) およびχ²検定 (p=2.2×10⁻¹⁶) を用いて有意差を評価した。
既知のPRDM9活性部位である高組換え率領域 (HRR) (Hussin et al. 2015) およびPRDM9特異的H3K4me3マーク領域 (Altemose et al. 2017) におけるSV集積をオッズ比 (OR) で評価した。ORは、PRDM9発現腫瘍におけるHRR内のSV数と非HRR内のSV数の比を、PRDM9非発現腫瘍における同様の比で割ることで算出した。95%信頼区間 (CI) とFisherの正確検定 (Bonferroni補正後p<0.05) を用いて有意性を判断した。AluおよびTHE1リピート要素がSV集積に与える影響を評価するため、これらの要素を含むSVは除外して解析を繰り返した。本研究では、HEK293T細胞株のデータも参照し、PRDM9の機能的影響を評価した。