• 著者: James Fraser, Iain Williamson, Wendy A. Bickmore, Josée Dostie
  • Corresponding author: Wendy A. Bickmore (Wendy.Bickmore@igmm.ed.ac.uk); Josée Dostie (josee.dostie@mcgill.ca)
  • 雑誌: Microbiology and Molecular Biology Reviews
  • 発行年: 2015
  • Epub日: 2015年7月29日
  • Article種別: Review
  • PMID: 26223848

背景

ヒトゲノムは約60億塩基対 (二倍体) から構成され、完全に伸ばすと約2メートルの長さになるDNAが直径6〜10マイクロメートルの細胞核内に高度に収納されている。この収納は単純な物理的折りたたみではなく、遺伝子転写・DNA複製・DNA修復という核機能が正確に制御されるために、ゲノムの空間的配置が本質的な役割を果たす。しかし2015年以前の研究では、ゲノムの三次元 (3D) 構造が転写制御にどのように作用するかという因果関係が十分に解明されておらず、特にゲノムスケールでの構造・機能関係の統合的理解が不足していた (gap in knowledge)。

FISH (fluorescence in situ hybridization) を用いた研究では染色体テリトリーの存在や遺伝子の核内位置が示されていたが (Lichter et al. 1988; Bolzer et al. 2005)、FISH は単一細胞の直接可視化に優れる一方、ゲノム全体の接触頻度をシステマティックに定量することが手薄であった。一方、Dekker et al. (2002) が開発した3C (chromosome conformation capture) 技術は特定の遺伝子座間の物理的接触を分子的に定量できたが、解析範囲が一対一に限られ全ゲノム規模の構造解析には不足していた。その後、4C (chromosome conformation capture-on-chip)・5C (chromosome conformation capture carbon copy)・Hi-C と高スループット技術が相次いで開発されたものの、それらが明らかにした哺乳類ゲノムの階層的空間組織と CTCF (CCCTC-binding factor)・コヒーシンなどの主要な調節因子の役割を統合した包括的フレームワークはまだ確立途上であった。これらの技術的蓄積を統合した体系的レビューが不足していたことが本稿の出発点である。

目的

FISH変法 (2D-FISH、3D-FISH、cryo-FISH) ・3C技術系 (3C、4C、5C、Hi-C、GCC (genome conformation capture)、TCC (tethered chromosome conformation capture)、ChIA-PET (chromatin interaction analysis by paired-end tag sequencing)) を含む主要なゲノム解析技術の開発経緯・原理・分解能を解説し、これらの技術が明らかにした哺乳類ゲノムの3D空間組織 (染色体テリトリー・A/B コンパートメント・TADs・クロマチンループ) とその転写制御への意義、および CTCF・コヒーシンによるゲノムアーキテクチャーの調節機構を包括的にレビューする。加えて Hi-C の核型解析・ゲノムアセンブリ・ハプロタイプ解析への応用と、細胞集団ベース 3C データの限界および今後の技術的発展の方向性も論じる。

結果

核内サブ構造 (核ラミナ・核孔・核小体):哺乳類ゲノムは核内複数のサブ構造との相互作用によって最低解像度での位置と機能が規定される。核ラミナは中間フィラメントタンパク質ラミンと核膜貫通タンパク質 NETs (nuclear envelope transmembrane proteins) から構成され、HP1 (heterochromatin protein 1) やヒストンと相互作用することで染色体の核内位置を制御する。LADs (lamin-associated domains) は0.1〜10 Mb の幅広いサイズ分布を持ち、転写不活性なヘテロクロマチンを多く含む。LADs は GC含量が低く遺伝子密度が低い「保存的 LADs」と、GC含量が高く組織特異的遺伝子を含む「細胞型特異的 LADs」に大別される。特定の遺伝子領域を実験的に核ラミナへ再配置するだけで遺伝子発現が抑制されることが示されており (Fig 1)、核内位置と転写活性の直接的関係が実証された。NPC (nuclear pore complex) は核-細胞質間のすべての輸送を媒介する巨大構造体で、質量は生物種によって約6,000万〜1億 Da の範囲にあり、>30 種類のヌクレオポリン (nucleoporin) タンパク質から構成される。NUP98 (nucleoporin 98) は NPC 構成要素としてだけでなく核内を自由に移動しながら独立して遺伝子に結合することが示されており、NPC がクロマチン区画化に寄与する可能性が提唱されている。核小体は複数染色体由来の rRNA 遺伝子が集積して形成され、NADs (nucleolus-associated domains) は LADs と大きく重複し、同様に GC 低含量・遺伝子希薄領域を持つ。ある遺伝子座は LADs と NADs のどちらかに局在し有糸分裂後に再分配が生じることが示されており、不活性クロマチンを核ラミナまたは核小体へ導く共通機構の存在が示唆されている。

FISH の進化と染色体テリトリー確立:FISH は 1969 年に Gall と Pardue がリボソームDNA の核内局在を同定した最初の in situ ハイブリダイゼーション研究から発展した技術で、核内 DNA 配列の位置を単一細胞レベルで直接可視化できる。FISH の感度と分解能はプローブサイズと顕微鏡の光分解能に依存し、フォスミドプローブ (~40 kb) では 100 kb 未満の空間距離を分解できないが、約10 kb のオリゴヌクレオチドプローブを用いれば 100 kb 以下の分解能が達成できる。通常の光学顕微鏡では xy 面で <200 nm、z 軸で <500 nm の構造を分解できないが、SIM では横方向分解能が約100 nm まで向上する (Fig 2)。2D-FISH はメタノール・酢酸 (MAA) 固定細胞を平坦化することで遺伝子の核内位置・染色体テリトリーとの相対位置を高速・明瞭に解析でき、3D-FISH は pFA (paraformaldehyde) 固定後の共焦点顕微鏡による z 方向スタックで遺伝子座の三次元共局在を検出する。Hoxd13 遺伝子とその四肢特異的遠位エンハンサーは発現細胞 (E10.5 四肢芽) において高頻度に共局在することが 3D-FISH で示され、エンハンサー・プロモーター間の物理的接触が転写制御に直結することが実証された。cryo-FISH では細胞ペレットをショ糖に浸漬後に液体窒素で凍結し 150〜200 nm 超薄凍結切片を作製することで、z 方向の分解能を低下させずに染色体テリトリーの空間的混合 (intermingling) を定量化できる。FISH 解析によって、遺伝子豊富な小型染色体 (ヒト染色体19番) が核内部に、類似サイズの遺伝子希薄染色体 (ヒト染色体18番) が核周辺部に優先的に局在する放射状位置の傾向が示されており、この特徴は霊長類・げっ歯類・ウシ・トリを含む複数種で保存されている。

3C 技術系の開発 (一対一→全ゲノム接触定量):3C は Dekker et al. (2002) が開発した手法で、(1)ホルムアルデヒドによる架橋、(2)制限酵素消化 (4塩基認識酵素で分解能 256 bp、6塩基認識酵素で 4,096 bp)、(3)希釈条件下での近接ライゲーション、(4)架橋解除・精製、(5)特定 PCR による定量という手順で指定した二つの DNA 領域間の接触頻度を初めて定量的に測定することを可能にした (Fig 2)。3C はβ-グロビンクラスターの赤芽球分化時における LCR (locus control region) と活性β-グロビン遺伝子との優先的物理接触の実証や、Shh 遺伝子と >1 Mb 離れたエンハンサー ZRS (zone of polarizing regulatory sequence) との四肢発生時の物理接触など、エンハンサー・プロモーターループの基礎的確立に貢献した。ただし、エンハンサー・プロモーター間のライゲーション産物はすべての制限断片の <1% に過ぎないことが示されており、接触頻度の解釈には慎重な統計的考察が必要である。4C (chromosome conformation capture-on-chip) は特定の bait 領域と全ゲノムとのすべての接触を同定する one-versus-all 法で、逆向き PCR プライマーと次世代シークエンシングを組み合わせることで高感度な全ゲノムインタラクションプロファイルが得られる。5C (chromosome conformation capture carbon copy) は多数のプライマーセットを用いたライゲーション媒介増幅 (LMA: ligation-mediated amplification) により特定ゲノム領域内の制限断片間の接触を最大数百万単位で同時測定できる many-versus-many 法で、ヒト Hox クラスターの三次元組織・X 染色体不活性化の調節ランドスケープ・発生的に制御されるクロマチンドメインの変化などに応用されてきた。Hi-C はビオチン-14-dCTP で制限断片末端を標識後にライゲーション・ストレプトアビジンビーズ濃縮・ペアエンドシークエンシングを行う all-versus-all 法で、ヒト・マウスゲノムでは通常 40 kb〜1 Mb 分解能で接触マトリクスが作成され、修正プロトコルではキロベース分解能が達成された。ChIA-PET (chromatin interaction analysis by paired-end tag sequencing) は ChIP ステップを先行させた上でビオチン化リンカーを介してライゲーション産物をシークエンシングする手法で、RNA Pol II・CTCF・エストロゲン受容体が媒介するクロマチン相互作用ネットワークを全ゲノムで同定できる点で Hi-C と相補的である。

ゲノムの階層的空間組織 (テリトリー・TADs・コンパートメント):CT (chromosome territory) の存在は FISH・3C 技術系双方で確立されており、4C や Hi-C によるシス内接触がトランス接触を大きく上回ることから確認されている。二倍体細胞の相同染色体間の接触は全染色体内接触の わずか 2% 程度に過ぎないことが示されており、遺伝子豊富な小型染色体同士はサイズ比以上に高頻度に接触する傾向を示す。Hi-C の初期研究では1 Mb 分解能で PCA を用いてヒト細胞のコンパートメント構造を解析し、ゲノムが「A コンパートメント」(開放型/活性型:GC高含量・遺伝子密度高・DNase I 高感受性・活性クロマチン標識 H3K36me3・H3K27me3 に富む) と「B コンパートメント」(閉鎖型/不活性型:自己会合傾向強、後期複製タイミングおよび LADs との高相関、H3K9me3 富む) に分離されることを発見した (Fig 3)。A/B コンパートメントはすべての哺乳類自常染色体・細胞型で観察されるが、コンパートメント内の接触は弱く広範に分布しており、一過性構造として成立する可能性も提唱されている。5C・Hi-C による高分解能解析からヒト・マウス・ショウジョウバエに保存されたTADs (topologically associating domains) が同定され、TAD の平均サイズは 0.5〜1 Mb で TAD 内接触が境界を越えた接触を大きく上回ることが確認された。TAD 境界は TSS (transcription start site)・活性転写・ハウスキーピング遺伝子・tRNA 遺伝子・SINE (short interspersed nuclear elements)・CTCF および cohesin の結合部位に濃縮されており、TAD 境界の配列欠失は隣接ドメインの部分的融合と周辺遺伝子発現の変化をもたらすことが実験的に示された。異なるアルゴリズムによる Hi-C データ再解析では、メガベース規模の TADs が平均 0.2 Mb の小さなドメイン (sub-TADs) から構成されており (Fig 3)、不変性のサブドメインは CTCF・コヒーシン依存で形成され、組織特異的なエンハンサー・プロモーター接触は Mediator・コヒーシン依存で媒介されるという機能的分業が示されている。ほとんどの長距離遺伝子発現調節はTAD内に制限されており、TAD 境界がエンハンサーの「作用距離」を制限する絶縁子として機能することが示された。

クロマチンループと転写ファクトリー:クロマチンループは 1878 年に Walther Flemming が両生類卵母細胞核内で最初に観察した構造にさかのぼるが、哺乳類では数百 kb 以下の小さなループが遺伝子転写制御の中心機構として認識されている。β-グロビンクラスターでは LCR が赤芽球分化時に β-グロビン遺伝子と優先的に物理接触し ACH (Active Chromatin Hub) を形成することが 3C で示されており、この接触頻度は非赤芽球細胞と比較して約 5-fold 増加し (n=3 独立実験で再現)、GATA-1・TAL1・EKLF1 などの赤芽球特異的転写因子や Ldb1 複合体がこのループ形成に必要とされた。マウス Shh 遺伝子は四肢発生時に >1 Mb 離れた別遺伝子イントロン内の ZRS エンハンサーによって活性化されその物理的接触が 3C で確認されており、Shh 活性時には染色体テリトリー外へのループアウトも 3D-FISH で観察された。ヒトゲノムの 1% を網羅した5C によるエンハンサー・プロモーター接触の包括的解析では >1,000 の長距離接触が同定され、エンハンサーが最近接遺伝子と相互作用するのは 7% にすぎず、TSS から 120 kb 上流との非対称な接触が最も頻繁であることが示された (deCarvalho et al. NatGenet 2018 らのがん研究でも、染色体外 DNA が正常な 3D ゲノム組織を乱しエンハンサー・プロモーター接触を撹乱することが示されている)。活性転写遺伝子が RNA Pol II・スプライシング因子・クロマチンリモデリング酵素とともに核内の「転写ファクトリー」に集積することが HeLa 細胞でのパルスラベリングで示されており、核内ファクトリー数は細胞種や検出手法によって数百〜数千個と報告されている。グロビン遺伝子は機能的に無関係な他の活性遺伝子と同一ファクトリーに局在することが報告されており、異なる染色体間 (trans) での活性遺伝子クラスタリングがゲノム組織化に重要な役割を果たすことが示されている。

CTCF・コヒーシン (ゲノムアーキテクチャー調節因子):CTCF (CCCTC-binding factor) は 11 個の zinc finger DNA 結合ドメインを持つ高度に保存されたタンパク質 (ニワトリ・マウス・ヒトで 100% 相同) で、ヒトゲノム全体に >30,000 の結合部位を持つ。CTCF は (1) インスレーター/バリア活性によるクロマチンドメインの境界形成、(2) エンハンサーブロッキングによる転写抑制、(3) 長距離クロマチン接触の媒介という多機能を発揮し、その機能的多様性は異なるジンクフィンガーの組み合わせが異なる結合タンパク質を採用するアロステリックシフト機構から生じると提唱されている。最もよく特徴づけられた CTCF クロマチンアーキテクチャーは Igf2/H19 インプリントされた遺伝子座で観察されており、母性アレルでは CTCF 結合が Igf2 と遠位エンハンサーとの接触を阻害するループを形成する一方、父性アレルでは DNA メチル化が CTCF 結合を阻害して Igf2・エンハンサー接触が可能になるという、古典的エピジェネティクスとゲノム空間配置の相互規定が初めて実証された。CTCF 結合部位の変異は Igf2/H19 インプリント異常症候群やハンチントン病における三ヌクレオチドリピート伸長など複数のヒト疾患との関連が示されている。コヒーシン (Smc1A・Smc3・Rad21・Stag1/2 から構成される多サブユニット複合体) は当初姉妹染色分体結合・有糸分裂染色体分配・DNA 修復への役割で認識されていたが、NIPBL (Nipped-B-like protein) 変異が CdLS (Cornelia de Lange syndrome) を引き起こすことから転写制御への関与が明確になった。CTCF 枯渇は TAD 内接触の減少と TAD 間接触の増加をもたらし境界機能を損なうのに対し、コヒーシン枯渇は TAD 内接触強度を低下させるが TAD の位置自体には影響しないという対照的な表現型から、CTCF は TAD 境界の位置決定に、コヒーシンは TAD 内における組織特異的接触の強化に機能的に分業していると理解されている。

Hi-C の応用展開 (核型・アセンブリ・ハプロタイプ):Hi-C が提供する全ゲノム接触情報は 3D ゲノム解析を超えた応用が可能である。染色体転座などの構造的異常は異なる染色体にマッピングされる配列間の高頻度接触として Hi-C データに検出でき、4C でもブレークポイントの位置が bait 領域と転座ドメインとの高頻度接触として可視化された。de novo ゲノムアセンブリでは LACHESIS プログラムが Hi-C と shotgun シークエンシングデータからコンティグを染色体群に分類・順序化・方向決定し、コンティグの順序と向きに関して 99% の精度が達成されたが、遺伝子豊富な小型染色体では相互作用頻度が高いために偽融合が生じやすいという限界も示された (PCAWG et al. Nature 2020 等の大規模ゲノム研究はこうした de novo アセンブリ技術の発展を前提としている)。65 件の未配置コンティグを Hi-C の長距離相互作用データのみから配置した研究では、混合マッピングおよび SNP (single nucleotide polymorphism) データを用いた別手法と高い一致を示した。ハプロタイプ解析では、二倍体細胞の Hi-C データにおいてシス内接触のうち相同染色体間に由来するものは わずか 2% であることが示され、修正 HapCUT アルゴリズムを用いることで既知ハプロタイプの 99.5% が Hi-C データのみから再構築できた (Roerink et al. Nature 2018 のような腫瘍内 heterogeneity 研究においても、このハプロタイプ解析基盤は重要な技術的前提となる)。これらの成果は Hi-C が 3D ゲノム構造解析のみならず、ゲノムシークエンシング・アセンブリ・臨床遺伝学的核型解析においても有力なツールであることを示している。

考察/結論

本レビューが確立した哺乳類ゲノムの5階層的空間組織モデル (染色体テリトリー・A/B コンパートメント・TADs・sub-TADs・クロマチンループ) は、これまでの研究が重点を置いてきた「線形ゲノムに基づく遺伝子制御」の概念と対照的に、3D 空間における物理的接触が転写制御の本質的な一側面を担うことを明確に示した。特に TADs の発見と CTCF による境界形成の実証は、これまで報告されていなかった遺伝子発現の空間的絶縁機構の体系的理解をもたらし、エンハンサーが同一 TAD 内の遺伝子のみを選択的に制御する「機能的マイクロ環境」という新規の概念を確立した。

臨床的意義として、ゲノム再編成による TAD 構造の破綻はエンハンサーハイジャッキングを通じたがん遺伝子の異常活性化を引き起こすメカニズムとして後続研究で実証されており、本レビューで確立した概念フレームワークはがん研究・発生疾患への臨床応用に直結する基盤を提供する。CTCF 結合部位の変異が Igf2/H19 インプリント異常症候群やハンチントン病など複数のヒト疾患を引き起こすことは、3D ゲノム組織の乱れが直接疾患を生じさせることの具体的証拠であり、3D ゲノム研究の臨床現場への橋渡し (bench-to-bedside) の重要性を示している。

既報の研究と異なる重要な指摘として、本レビューは FISH (直接可視化・単一細胞情報) と 3C 技術系 (集団平均・分子的定量) のデータが高分解能では必ずしも一致しないことを明示している。5C と FISH とが時として不一致を示すという観察は、3C データの解釈において「接触頻度≠物理的距離」という単純な仮定が成立しない場合があることを示し、接触頻度が実際の物理的距離以外のパラメータ (クロマチン可撓性・架橋効率・細胞集団における可変性) の影響を受けることを示唆した。このことは 3C 技術系の本質的な技術的限界として、これまでの研究では明示されていなかった重要な概念上の課題である。

残された課題として、(1) ゲノム構造と転写活性の因果関係の詳細解明 (今後の検討)、(2) 細胞集団ベース 3C データに内在する平均化バイアスの克服 (future research、単一細胞 Hi-C の発展)、(3) 細胞種・発生段階・疾患における動的構造変化の定量的追跡、(4) 染色体の倍数性・ハプロタイプを考慮した接触解析、(5) 超高分解能 Hi-C と次世代計算ツールの開発による TAD・sub-TAD の真の分子的実体の解明、が強調されている。特に 3C 系技術が細胞集団の接触の平均値を反映し個々の細胞間のコンフォメーション不均一性 (limitation) を捉えられないことは、実際の生体内クロマチンアーキテクチャーを反映しているものとアクセシビリティに基づく架橋産物との区別という根本的な課題を提示している。また Hi-C が必要とする細胞数 (~1×10^7 細胞) は試料入手の観点から limitation となる。ゲノム規模の三次元地図と表観遺伝学データとの統合、ゲノムキャプチャー技術との組み合わせが知識ギャップを埋める更なる検討として展望されている。

方法

本レビューの対象は、PubMed を通じて検索・精選した FISH 法・3C 関連技術・ゲノム構造解析に関する一次研究論文・プロトコル論文・技術解説論文である。文献は哺乳類 (ヒト・マウス) のゲノム空間組織を中心とし、比較のために酵母 (Saccharomyces cerevisiae)・大腸菌・線虫・ショウジョウバエのデータも参照した。計算的・統計的手法として、Hi-C 接触マトリクスの Pearson 相関係数 (Pearson correlation coefficient) 行列に対する PCA (principal component analysis) によるコンパートメント分離、DI (directionality index) を用いた TAD 境界算出、MCMC (Markov chain Monte Carlo) サンプリングによる 5C/Hi-C データからの 3D クロマチンモデリング、LACHESIS (ligating adjacent chromatin enables scaffolding in situ) アルゴリズムを用いた Hi-C ベースの de novo ゲノムアセンブリ、修正 HapCUT アルゴリズムによるハプロタイプ再構築が参照論文で使用されている。直接可視化法としては 2D-FISH (メタノール・酢酸固定)、3D-FISH (pFA 固定、共焦点顕微鏡)、cryo-FISH (液体窒素凍結、150-200 nm 超薄切片)、および SIM (structured illumination microscopy)・STED (stimulated emission depletion microscopy)・PALM/STORM (single-molecule localization microscopy) などの超解像顕微鏡法が対象に含まれる。各論文で使用されたヒト細胞株・マウス胚細胞・赤芽球・ES 細胞・HeLa 細胞・リンパ球などが実験系として参照されている。