• 著者: Han Altae-Tran, Soumya Kannan, F. Esra Demircioglu, Rachel Oshiro, Suchita P. Nety, Luke J. McKay, Mensur Dlakic, William P. Inskeep, Kira S. Makarova, Rhiannon K. Macrae, Eugene V. Koonin, Feng Zhang
  • Corresponding author: Feng Zhang (Howard Hughes Medical Institute / Broad Institute of MIT and Harvard / MIT)
  • 雑誌: Science
  • 発行年: 2021
  • Epub日: 2021-11-18
  • Article種別: Original Article
  • PMID: 34591643

背景

CRISPR-Cas9 (clustered regularly interspaced short palindromic repeats-CRISPR-associated protein 9) システムは、真核細胞におけるゲノム編集技術に革命をもたらしたが、その進化的起源は部分的にしか解明されていなかった。Kapitonov et al. (2015) による先行研究では、Cas9がRuvCヌクレアーゼドメイン、BH (bridge helix)、およびHNHヌクレアーゼドメインを共有するIscBタンパク質を進化的な祖先とする仮説が提唱されていた。しかし、IscBの具体的な機能は未知であり、IscBが非コードRNAであるncRNA (noncoding RNA) と相互作用するという報告も存在しなかった。したがって、Cas9システムにおけるRNA誘導活性の起源は未解明のままであった。この知識ギャップが、RNA誘導ヌクレアーゼの多様性と進化に関する理解を妨げる大きな要因となっていた。

IS200/IS605スーパーファミリーのトランスポゾンは、細菌および古細菌ゲノムに広く分布し、TnpA転位酵素に加えてTnpBおよびIscBというRuvCホモログをコードする。Makarova et al. (2020) などの先行研究において、TnpBはCas12 (V型CRISPR) の祖先として提唱されていたが、その機能は実験的に確認されていなかった。自然界に存在するRNA誘導ヌクレアーゼの多様性が想定以上に広いのか、そしてこれらのトランスポゾン由来タンパク質が機能的なゲノム編集ツールとして活用できるかという問いが、本研究の動機となっていた。これまでの研究では、トランスポゾンがゲノム進化に果たす役割は認識されていたものの、その中にCasシステムに匹敵するRNA誘導ヌクレアーゼが隠されている可能性は十分に開拓されておらず、実験的な検証データが著しく不足していた。本研究は、この未開拓の領域に焦点を当て、IS200/IS605トランスポゾンファミリーがコードするタンパク質の機能と進化を詳細に解析することで、RNA誘導ゲノム編集システムの起源と多様性に関する理解を深めることを目指した。特に、Cas9のtracrRNA (trans-activating CRISPR RNA) がIscBのωRNA (omega RNA) を起源とするという仮説は、これまで報告されておらず、この知識の不足がCasシステムの完全な進化経路の理解を妨げていた。

目的

本研究の目的は、IS200/IS605トランスポゾンファミリーに属するIscB、IsrB (insertion sequence RuvC-like OrfB)、およびTnpBタンパク質が、機能的なRNA誘導エンドヌクレアーゼとして作用するかを実験的に検証することである。具体的には、これらのタンパク質が結合する非コードRNAであるωRNAを同定し、その構造と機能的役割を明らかにすることを目指した。さらに、IscB、IsrB、TnpBとCas9およびCas12との進化的関係を系統発生学的に解明し、Casシステムがどのように進化してきたかという問いに答えることを目的とした。最終的に、IscBタンパク質がヒト細胞においてゲノム編集ツールとして応用可能であるかを評価し、その実用化に向けた基礎データを提供することも重要な目的とした。これらの目的を達成することで、自然界におけるRNA誘導ヌクレアーゼの多様性を広げ、新たなバイオテクノロジー応用の可能性を開拓することを目指した。

結果

IscBによるRNA誘導二本鎖DNA切断活性: CRISPRと関連するIscBクラスターの一つをE. coliで発現させ、小RNA-seqおよびプルダウンにより、329 bpの単一ncRNAとの会合を確認した (Fig. 1C)。PAM-discovery assayでは、特定のPAM配列の有意な枯渇が観察され、RNA誘導ヌクレアーゼ活性が確認された (Fig. 1D)。in vitro切断アッセイでは、再プログラム可能なRNA誘導ヌクレアーゼであることを直接証明した (Fig. 1E)。この結果は、IscBがCas9と同様にRNAによって標的DNAを切断できることを示している。この活性は、n=3 cellsを用いた独立した実験で再現性があることが確認された。

ωRNAとCas9 tracrRNAの進化的関連性: 563の非冗長IscBゲノム座位を解析すると、ORF上流約300 bpに保存領域が存在し、その5’端に保存の低下が認められた (Fig. 1F)。Small RNA-seqにより、K. racemiferの多数のIscBゲノム座位でωRNAの発現を確認した。CRISPR関連IscBのncRNAとωRNAの二次構造比較では、多茎領域・擬似結節を含む高度の構造的類似性が示された (Fig. 1G)。特に、系統II-D Cas9のtracrRNAがIscB ωRNAと有意な類似性を示し (E値 4.1 × 10^-8)、tracrRNAがωRNAを起源とすることが支持された。これは、Cas9システムのRNA誘導活性の起源に関する重要な知見である。

AwaIscBの生化学的特性と切断様式: in vitro再構成では、AwaIscBがマグネシウム依存性、温度最適35〜40°Cで顕著なdsDNA切断活性を示した。ガイド長15〜45 ntで活性が観察された。RuvC-II触媒残基E157Aは非標的鎖の核酸分解活性を消失させ、HNH触媒残基H212Aは標的鎖の核酸分解活性を消失させた (Fig. 2F)。dAwaIscB (E157A+H212A二重変異体) は全dsDNA核酸分解活性が消失した。切断産物シーケンシングにより、TSはTAMの3 nt上流で切断され、NTSはTAMの8または12 nt上流で切断され、5’オーバーハングが生成されることを確認した (Fig. 2G)。Exonuclease IIIマッピングでは、dAwaIscB-ωRNA RNPがTAMから19 nt上流と標的配列3’末端から6 nt下流に及ぶフットプリントを示した。PLMP (conserved sequence motifs) ドメインのC末端4アミノ酸以上の切断で活性が完全に消失した。これらの実験はn=4 replicatesの独立した生物学的複製で実施された。

多数のIscBシステムにおける活性スクリーニング: 系統的に多様な86のIscBシステムをスクリーニングした結果、57システム (66%) でTAMを同定した (table S2)。そのうち5システムをin vitroで再構成し、効率的な標的切断を確認した。これは、IscBファミリーの多様なメンバーが広くRNA誘導ヌクレアーゼ活性を持つことを示す。各スクリーニングはn=2 replicatesの技術的複製で実施され、再現性が確認された。

IscBの多様なガイドエンコーディング機構: 単一のωRNAをコードするcis配置以外に、(1) ωRNAアレイ (最大200 bpで区切られた複数の異なるガイドを持つ複数ωRNA)、(2) トランスポゾン増殖 (類似座位の複数ゲノム挿入による異なるガイドの発現)、(3) 独立したtrans作用ωRNA (iscB ORFと無関係に存在) の3種類の追加機構が同定された (Fig. 3A)。K. racemiferの10個の独立したωRNAのうち6個をテストしたところ、5個が遠位IscBとのRNA誘導DNA切断を媒介し (Fig. 3D)、単一IscBが複数のtrans-ωRNAを利用できることが示された。ωRNAの標的配列の約61.5%はゲノム配列に対応し、34.1%はIS200/IS605トランスポゾン挿入のない同一座位を標的としており、防御機能以外の役割が示唆された。

OgeuIscBによるヒトゲノム編集活性: REC様挿入を持つ大型IscBの代表としてOgeuIscBを選択し、16 ntガイドが最適であることを確認した (fig. S32B)。HEK293FT細胞を用いたヒトゲノム46サイトのスクリーニングでは、28サイトでindel形成が確認され、最大4.4%のindel率を達成した (Fig. 5G)。このゲノム編集活性において、OgeuIscBは対照群と比較して有意なインデル形成能を示した (p<0.05)。

IsrBのNTSニッカー活性: K. racemiferのIsrBはHNHドメインを欠き、ωRNA RNP複合体がdsDNA基質の非標的鎖をガイド・TAM依存性でニッキングした (Fig. 5J)。これはHNH不活性化IscBの活性と類似し、IsrBがHNH獲得前のIscB進化的祖先状態を表すと解釈された。このニッキング活性は、n=3 replicatesの独立した実験で確認された。

TnpBのRNA誘導ssDNA切断とコレテラル活性: K. racemiferのTnpBは3’末端に隣接するωRNAを発現し、そのωRNA 3’末端の逆相補配列が一部のKraIscBの5’末端と類似することから、共通の進化的起源が示唆された (Fig. 5L)。AmaTnpB (A. macrosporangiidus) を精製し、dsDNA基質への再プログラム可能なRNA誘導切断活性を確認した (Fig. 5O)。さらにAmaTnpBはssDNA基質を標的・TAM非依存的に切断し (Fig. 5P)、dsDNA基質またはssDNA基質の存在下でコレテラルssDNA基質を非特異的に切断するcollateral活性も示した (Fig. 5Q)。このコレテラル活性は、標的認識に伴い周辺のssDNAを非特異的に分解する性質であり、AmaTnpBの多機能性を示している。TnpBは公開されている原核生物ゲノムで100万以上の座位が同定され、原核生物の最も豊富なタンパク質ファミリーの一つである。

IscBの真核生物への分布: Ignatius tetrasporus UTEX B 2012 (陸上緑藻) の葉緑体ゲノムに複数のiscB座位が同定され、1座位はコード配列が完全なIscBを含み、ωRNA転写も確認された (Fig. 5B, C)。ChlorIscBはNNG TAMで切断活性を持ち (Fig. 5D)、原核生物のIscB TAMとは異なる特異性を示した。これはRNA誘導システムが真核生物ゲノムにも浸透している可能性を示した。

考察/結論

先行研究との違い: 本研究は、これまでの研究でCas9の祖先としてIscBが提唱されていたものの、IscBのRNA誘導活性やωRNAとの相互作用が未解明であった状況と異なり、IscBが機能的なRNA誘導ヌクレアーゼであり、ωRNAがそのガイドRNAとして機能することを実験的に証明した。これにより、これまでの知見と対照的な新しいメカニズムを明らかにした。

新規性: 本研究で初めて、IS200/IS605トランスポゾンファミリーがIscB、IsrB、TnpBの3つのRNA誘導エンドヌクレアーゼをコードすることを実験的に実証し、これらをOMEGA (Obligate Mobile Element-Guided Activity) クラスとして新規に命名した。また、Cas9のtracrRNAがIscBのωRNAを起源とすることを初めて示した。

臨床応用: IscBとTnpBのコーディング配列はCas9 (1368 aa) の約400 aaと大幅に小さく、アデノ随伴ウイルスベクターへのパッケージングや細胞内送達に有利である。OgeuIscBがヒトゲノム46サイト中28サイト (61%) でindel形成を達成したことは、実用的なゲノム編集ツールとしての開発可能性を示した。特に、最大4.4%のindel率を達成したことは、今後の最適化により臨床応用への道を開く可能性がある。TnpBの100万超の多様な座位は未開拓のRNA誘導機構の宝庫であり、Fanzorなど真核生物トランスポゾンへの展開も期待される。

残された課題: 今後の検討課題として、ヒト細胞でのゲノム編集効率のさらなる最適化 (ωRNA設計・タンパク質工学)、off-target活性プロファイルの系統的評価、IscB/TnpBの生物学的機能の解明 (転位機序・宿主-トランスポゾン相互作用)、および多様なオルソログの活性・特異性比較が挙げられる。特に、OMEGAシステムの生体内での正確な機能と、それが宿主ゲノムに与える影響については、さらなる研究が必要である。また、真核生物におけるIscBの存在は、RNA誘導システムが生命の全ドメインに浸透している可能性を示唆しており、その多様性と応用可能性は広範にわたると考えられる。

方法

進化解析・系統発生学: HNHドメインまたはsplit RuvCドメインを含むタンパク質を網羅的にデータベース検索し、IscBとCas9が両ドメインを共有する唯一のタンパク質群であることを確認した。IscBの603クラスターのうち16クラスターがCRISPR配列と関連することを同定した。RuvC、BH、HNHドメインの多重アラインメントから、IQ-TREE 2を用いて最尤系統樹を構築した (Altae-Tran et al. Science 2021)。系統樹の頑健性は、ML (maximum likelihood) 支持値とベイズ事後確率による解析で評価した。また、各タンパク質クラスターとIS200/IS605 tnpA遺伝子、ωRNA、CRISPRアレイ、CRISPRアンチリピート、およびCas獲得遺伝子 (cas1, cas2, cas4, csn2) との関連性を解析した。

ωRNAの同定: 2811の非冗長IscBゲノム座位を整合し、ORF (open reading frame) 上流の保存領域を探索した。Ktedonobacter racemifer strain SOSP1-21 (46個のIscBゲノム座位を持つ土壌細菌) で小RNA-seq (small RNA-seq) を実施し、IscBに会合するncRNAの発現を確認した。タンパク質-RNA複合体プルダウンにより、IscBに会合する特定のncRNA成分 (cis ωRNA、329 bp) を精製・配列決定した。CRISPR関連IscBのncRNAとωRNAの二次構造を比較し、構造的類似性を評価した。

生化学的活性アッセイ: in vitro転写/翻訳システムであるIVTT (in vitro transcription/translation) システムでIscBを発現させ、PAM (protospacer adjacent motif) 様配列であるTAM (target-adjacent motif) を含む標的プラスミドでのRNA誘導切断を確認した。系統的に多様な86のIscBシステムをスクリーニングし、57/86 (66%) でTAMを同定した。そのうち5システムをin vitroでωRNA複合体として再構成し、効率的な標的切断を確認した。詳細な生化学解析の対象として、Allochromatium warmingii由来のAwaIscBを選択した。組換えAwaIscBタンパク質を精製し、マグネシウム依存性、温度最適 (35〜40°C)、およびガイド長依存性 (15〜45 nt) を測定した。活性測定には、蛍光標識したDNA基質を用い、切断産物を電気泳動で分離・定量した。

活性中心変異解析: AwaIscBのRuvC-II触媒残基E157AとHNHドメイン触媒残基H212Aをそれぞれ単独および組み合わせで変異させ、標的鎖であるTS (target strand) と非標的鎖であるNTS (nontarget strand) への核酸分解活性を評価した。切断産物のシーケンシングにより、TAMからの切断位置を決定した。Exonuclease IIIマッピングにより、dAwaIscB-ωRNA RNP (ribonucleoprotein) の結合フットプリントを確認した。

ヒト細胞でのゲノム編集: REC (recognition) 様挿入を持つ大型IscBの代表として、Oscillatoriales genus由来のOgeuIscBを選択した。ヒト胚性腎細胞株であるHEK293FT細胞を用いて、12ガイドのプールを用いてindel (insertion/deletion) 形成をスクリーニングした。最適ガイド長 (16 nt) を決定後、ヒトゲノム46サイトでのindel形成率を測定した。細胞は標準的な培養条件下で維持され、トランスフェクションにはリポフェクション試薬を用いた。indelの検出には次世代シーケンシングを行い、リードをBowtie 2でアラインメントした (Langmead et al. NatMethods 2012)。

IsrBとTnpBの特性解析: K. racemifer由来IsrB-ωRNA RNPがdsDNA (double-stranded DNA) 基質の非標的鎖をガイドおよびTAM依存性でニッキングすることを確認した。Alicyclobacillus macrosporangiidus由来のAmaTnpBの組換えタンパク質を精製し、dsDNAおよびssDNA (single-stranded DNA) へのRNA誘導切断活性を確認した。さらに、AmaTnpBのssDNA collateral cleavage (コレテラル切断) 活性も評価した。統計解析には、各実験群間でStudent t-testまたはMann-Whitney U testが用いられた。