- 著者: Andrew C. Payne, Zachary D. Chiang, Paul L. Reginato, Sarah M. Mangiameli, Evan M. Murray, Chun-Chen Yao, Styliani Markoulaki, Andrew S. Earl, Ajay S. Labade, Rudolf Jaenisch, George M. Church, Edward S. Boyden, Jason D. Buenrostro, Fei Chen
- Corresponding author: Edward S. Boyden (MIT, Cambridge, MA); Jason D. Buenrostro (Harvard University, Cambridge, MA); Fei Chen (Broad Institute, Cambridge, MA)
- 雑誌: Science
- 発行年: 2021
- Epub日: 2021-01-14
- Article種別: Original Article
- PMID: 33384301
背景
ゲノムは塩基対から染色体に至る多階層的な三次元空間構造を持ち、この構造が遺伝子発現調節と細胞機能に重要な役割を果たすことが明らかにされてきた。先行研究として、Lieberman-Aiden et al. 2009 がHi-C (Chromosome Conformation Capture) を開発し全ゲノムスケールのクロマチン相互作用マップを実現し、Rao et al. 2014 がキロ塩基解像度Hi-Cでタポロジカルアソシエーティングドメイン (TAD) を同定した。Buenrostro et al. 2013 はATAC-seqでクロマチンアクセシビリティを全ゲノム解析し、DNA FISHから Hi-Cに至るゲノム構造研究の技術的変遷は (Fraser et al. MicrobiolMolBiolRev 2015) に詳述されている。ゲノム解析のバイオインフォマティクス基盤として、Langmead & Salzberg 2012 のBowtie 2アライメント (Langmead et al. NatMethods 2012) やQuinlan & Hall 2010 のBEDTools (Quinlan et al. Bioinformatics 2010) もIGS解析パイプラインで活用された。しかし、シーケンシングベース手法 (Hi-C・ATAC-seq等) はゲノム全域を塩基対解像度で解析可能だが細胞の空間的文脈が失われるという限界があり、顕微鏡ベース手法 (DNA FISH等) は空間情報を保持するがゲノムカバレッジが限られ塩基対解像度がないという制約を持つ。この2つのモダリティを同一細胞内で同時に統合する手法は未確立であり、既存技術では到達不能であった。特に初期発生段階では少数の細胞しか存在せず、親由来 (maternal/paternal) のゲノム構造の非対称性・クロマチンリプログラミングの実態を直接観察する手段が不足していた。また単細胞間の染色体位置の多様性や、細胞分裂を越えて継承されるエピジェネティック記憶の実証的証拠も未検証のままであり、同一試料内でDNA配列と三次元空間構造を同時解析する技術が足りなかった。
目的
無傷の生物学的試料 (細胞・組織・胚) 内でゲノムDNAを直接シーケンシングし、DNA塩基配列と三次元ゲノム構造 (染色体の空間配置) を同時に決定する新技術IGS (in situ genome sequencing) を開発すること。ヒト線維芽細胞および初期マウス胚への適用を通じて本手法の生物学的妥当性を実証し、既存手法では到達不能だった単細胞レベルのゲノム構造知見を獲得すること。
結果
所見1:IGSの基本性能と品質指標: ヒト線維芽細胞 (PGP1f) では解析可能なアンプリコンの87.6%がex situゲノムリードと照合可能であった (Fig. 1)。マウス胚全体では61.0%の照合率で、最終的に合計286,335の空間的局在ゲノムリード (PGP1f: 36,602、マウス胚: 249,733) が取得された。UMI照合の偽陽性率 (FDR) はPGP1fで1.70%、マウス胚で0.05%であった。1核あたりのリード中央値はPGP1f: 328±114リード (±SD)、接合子: 3,909±2,116リード、2細胞期: 2,357±1,063リード、4細胞期: 1,074±622リードであった。ゲノムカバレッジはhg38・mm10参照ゲノムとも全ゲノムシーケンシングに相当し、核内の半径方向位置やクロマチンアクセシビリティによる偏りは認められなかった。
所見2:ヒト線維芽細胞でのゲノム構造検証と染色体位置解析: PGP1f細胞において各常染色体のリードが2つの明確な空間クラスターに共局在し (各半数体ゲノムの染色体テリトリー)、X染色体は1クラスターにのみ局在することが確認された (男性由来細胞) (Fig. 2)。最大尤度推定アプローチで染色体テリトリーを定義したところ、6.83%のリードがいずれのクラスターとも共局在せず、これは染色体長距離ループの反映と考えられた。ゲノムワイドな10 Mb解像度の染色体ペア間距離マトリクスでは対角線に沿った短距離ブロック (染色体テリトリー内の近接) が明確に認められた。染色体サイズと核中心からの距離は正の相関を示し (小染色体ほど核中心付近に局在)、ヒト線維芽細胞の既知知見と一致した。反復配列 (ゲノムの約13.9%が非ユニークアライン) の空間分布解析では、Aluエレメントが核周辺部から~1 μm離れた領域に乏しく (先行FISH報告と一致)、特定のサテライトDNAは核中心近傍に富み、AT高含量L1エレメントは核周辺部に集積することが示された。
所見3:初期マウス胚での親由来別ゲノム構造の動的変化: n=24 samples (PN4接合子) ではn=57 samples (総胚数) のうち精子由来 (paternal) と卵子由来 (maternal) のゲノムが明確に分離した大核 (paternal) と小核 (maternal) 内に局在し、ハプロタイプ特異的リードの97.1%が既知の分布と一致した (Fig. 3)。haplotype separation score (HS score) の解析では、接合子から2細胞期 (K-S test, P<10-8)、2細胞期から4細胞期 (K-S test, P<10-3) にかけてHS scoreが有意に低下し、発生進行とともに親由来ゲノムが徐々に混合することが定量的に示された。混合の程度は胚内で不均一であり (SD: 0.015 → 0.026 → 0.045 と各発生段階で増加)、特定の染色体が混合に先行するという証拠は得られなかった (漸進的グローバル染色体再配置と矛盾しない)。2・4細胞期胚では染色体セントロメア-テロメア軸が核内で高度に極性化 (Rabl様配置、centromere-telomere score Pearson r: 0.519・0.502) していたが、接合子ではこの極性化はほとんど認められなかった (r=0.074)。
所見4:接合子での親由来別GC含量-核ラミナ距離相関の非対称性: 接合子のChr 12について各1 Mbビンで GC含量と核ラミナ距離の相関を解析したところ、paternal pronucleus (Spearman r=0.794) とmaternal pronucleus (Spearman r=0.649) の両方で有意な正の相関が認められ (GC低含量領域ほど核周辺部に局在)。この相関はpaternal で maternal より有意に強く (全染色体での比較、K-S test, P<10-5)、接合子段階のみで認められ (2細胞期では有意差なし、n.s.)、精子由来と卵子由来のクロマチンの異なるエピジェネティック履歴を反映すると解釈された。さらに paternal pronucleus ではChr Xが核周辺ではなくnucleolar precursor body (NPB) 近傍に局在するという予期せぬ知見も得られ、刷り込みX染色体不活化における非対称性確立への関与が示唆された。
所見5:単細胞クロマチンドメインの検出とエピジェネティック記憶: 接合子のパターナル・マターナル各プロニュークレイスにおいてスケーリング解析を実施したところ、各親由来ゲノムが異なるスケーリング特性を示し、単細胞レベルでの染色体ドメイン境界が検出可能であることが示された。クローナルな細胞系列解析では、2・4細胞期胚の姉妹細胞間での染色体の核内位置相関が偶然以上に保存されており (特定染色体が核内部または核周辺に局在する傾向が細胞分裂後も継承)、染色体位置の「エピジェネティック記憶」が確率論的ではあるが有意に維持されることが実証された。この観察は姉妹細胞間の染色体再配置が完全にランダムではなく、細胞分裂プロセスにおける染色体位置情報の部分的な継承機構の存在を示唆する。
考察/結論
本研究はゲノムシーケンシングと三次元空間情報を統合した初の方法論IGSを開発し、本研究で初めてDNA塩基配列と染色体三次元構造を単一細胞内で同時定量することを可能とした技術的革新を達成した。先行研究であるLieberman-Aiden et al. 2009のHi-C・Buenrostro et al. 2013のATAC-seq・DNA FISHとは異なり、IGSは単一細胞内で塩基対解像度のゲノム情報と3D空間座標を同時取得し、既存手法では到達不能だった知見を提供した。
接合子でのpaternal-maternal間GC compartmentalization強度の有意差 (P<10-5) は、精子と卵子が異なるエピジェネティック履歴 (精子: プロタミンからヒストンへの置換後の「素の」クロマチン; 卵子: 成熟オーサイト特有のクロマチン構造) を持つことに起因すると解釈される。この親由来別クロマチン構造の非対称性が初期胚の遺伝子活性化 (ZGA: Zygotic Genome Activation) の空間的制御に寄与する可能性が提示された。染色体位置のエピジェネティック記憶の発見は、細胞分裂後の遺伝子発現パターンの維持・細胞運命特定化における「構造的記憶」の新概念を提示した。
臨床応用の観点では、腫瘍組織への臨床応用が実現すれば、単細胞レベルの染色体不安定性・エピゲノム異常・空間的腫瘍不均一性の同時解析が可能となり、がんゲノム進化の理解を大きく進展させる可能性がある。臨床的意義として、本手法は希少細胞 (循環腫瘍細胞・術中生検等) のゲノム構造解析にも応用可能であり、精密医療の新しい基盤技術となりうる。
残された課題と今後の展望として、(1) 現時点での空間解像度は~400-500 nm (100 kb以上のゲノムスケール) であり、TAD (Topologically Associating Domain) や染色体ループ (~10-100 kb) レベルへの高解像度化、(2) スループットの向上 (現状は1核あたり数百〜数千リードのカバレッジ)、(3) 厚い組織切片への適用拡張 (腫瘍・脳組織等)、(4) RNAシーケンシング・エピゲノム解析との多層オミクス統合 (IGS+scRNA-seq等) が重要な方向性である。
方法
IGSの技術的ワークフロー: 試料固定後にTn5トランスポサーゼによるin situ転位反応でゲノムDNAにシーケンシングアダプターをランダムに挿入 (空間位置を保持したまま断片化)。2本のDNAヘアピン (UMI・プライマーサイトを含む) のライゲーションにより断片をin situで環状化し、ローリングサークル増幅 (RCA) でクローン増幅した (~400-500 nm アンプリコン)。次いで蛍光in situシーケンシング (SBL: sequencing by ligation) の複数サイクルで各アンプリコンのUMIを空間座標付きで読み取り、その後アンプリコンを解離・PCR増幅してIlluminaプラットフォームで150 bp ペアエンドシーケンシング (ex situ) を実施した。確率論的エラー修正アルゴリズムでin situ UMIとex situリードを照合し、ゲノム座標と3D空間座標の同時取得を実現した。
適用サンプル: (1) ヒト二倍体線維芽細胞 (PGP1f) 106細胞。(2) C57BL/6×C3H F1 (B6C3F1) 雌マウスとC57BL/6×DBA/2 F1 (B6D2F1) 雄マウスから得たPN4接合子 (n=24 samples)・後期2細胞期 (n=20 samples)・初期4細胞期 (n=13 samples) の計57胚・113細胞。胚実験ではCENP-A (セントロメア) ・Lamin-B1 (核ラミナ) の免疫染色を同時実施した。親由来の識別は両親系統間のSNP情報 (ヘテロ接合型SNP) を利用した。