- 著者: Edward J. Hollox, Luciana W. Zuccherato, Serena Tucci
- Corresponding author: Edward J. Hollox (University of Leicester, Leicester, UK)
- 雑誌: Trends in Genetics
- 発行年: 2022
- Epub日: N/A
- Article種別: Review
- PMID: 34284881
背景
ゲノム進化研究はこれまで一塩基多型 (SNV) に集中してきたが、SV (structural variant; 構造変異) と総称される大規模ゲノム変化 (一般に >100 bp; 欠失・重複・逆位・転位因子挿入・複雑再編成を含む) は機能的に重要であるにもかかわらず研究が遅れていた。SV のうち DNA コピー数を変化させるものを CNV (copy number variant; コピー数変異)、特に多アレル性のものを mCNV (multi-allelic copy number variant; 多アレル CNV) と呼ぶ。先行研究として、Redon et al. (2006) がアレイ比較ゲノムハイブリダイゼーション (aCGH; array comparative genomic hybridization) でヒトゲノム全体の CNV 分布を初めて体系的に示し、Sudmant et al. (2015) が 1000 Genomes Project のショートリードデータで 2,504 個体の統合 SV マップを構築したことで、SV の量的規模の基本的理解が得られた。Perry et al. (2007) はアミラーゼ遺伝子 AMY1 (salivary amylase gene 1; 唾液アミラーゼ遺伝子) のコピー数変異と食事の関係を初めて実証し、食事適応における SV の役割を明示した。これらの先行研究はショートリードシークエンシングを基盤としており、SD (segmental duplication; セグメンタル重複) 領域では誤マッピングが生じやすく、スプリットリード・ディスコーダントペア・リードデプスいずれの手法でも影響を受けるという方法論的制約があった。
Pacific Biosciences・Oxford Nanopore のロングリードシークエンシングはこの問題を大幅に解消し、SV 発見を加速させた。HPRC (Human Pangenome Reference Consortium) や HGSVC (Human Genome Structural Variation Consortium) が新たなデータを提供しており、それぞれテロメア-テロメアアセンブリの多様化と 32 二倍体ゲノムのロングリード解析を推進した。HGDP (Human Genome Diversity Panel) やシモンズゲノム多様性プロジェクト SGDP (Simons Genome Diversity Project) は集団横断的な解析基盤を提供した。しかしながら、SV の集団遺伝学的解析手法は未確立 (controversial) な部分が多く、SLiM (selection on linked mutations; 集団遺伝シミュレーター) 等は染色体長変動を許容しないため、SNV とは異なる専用手法の開発に知識のギャップが存在していた。何が足りなかったかといえば、SV の全スペクトル (特に <5 kb の小型 SV) を正確に把握する技術と、集団特異的適応を示す SV の機能的証拠の双方が不十分 (insufficient) であった。
目的
ヒト進化における SV の役割を4軸で包括的にレビューする: (1) 検出技術の進歩とゲノム中の SV の量的規模、(2) ヒト特異的 SV による脳・解剖学的特徴の変化、(3) 集団特異的 SV による環境適応 (食事・感染症)、(4) 古代ホモニン (Homo neanderthalensis・デニソワ人) からの SV 浸透とその適応的意義。
結果
所見1:SV の量的規模・検出精度革新・eQTL としての機能的影響:
1000 Genomes Project の 2,504 個体解析では、578 個の SV が集団間で高い頻度差を示し (Table 1 参照)、異種代謝・細胞接着関連遺伝子が多アレル CNV および重複に過剰に含まれており、環境適応候補として浮上した。HGSVC の 32 二倍体ゲノムのロングリードアセンブリでは、ショートリードで検出された SV の >75% がロングリードでも確認できる一方、ロングリードで検出された SV の70% はショートリードでは見逃されており、見逃しのほとんどが <5 kb の小型 SV であった (Figure 1B 各手法の比較参照)。HGDP の 911 個体・54 集団解析はさらに多くの SV を同定し、現代人ゲノムにおけるアーキックホモニン由来 SV の過剰存在を確認した。機能的証拠として、13 組織を対象とした eQTL (expression quantitative trait locus; 発現量的形質遺伝子座) 研究では SV が全 eQTL の最大 6.8% を占め、SNV-eQTL より平均効果量が大きいことが示された (n = 1,500 以上の遺伝子で発現量が少なくとも1つの SV と有意に相関)。これらの SV の多くが遠位クロマチンループアンカーと重複することから、クロマチン構造の局所的変化が SV による遺伝子発現調節の主要なメカニズムと考えられる。β-デフェンシン遺伝子クラスターでは mCNV によるコピー数増加が粘膜表面での抗菌タンパク量と抗菌活性の増大に直結する遺伝子量効果が実証されており、CNV が量的形質に機能的に直結することが確認されている。gnomAD のエクソームデータ解析でも新たな低頻度・中程度頻度の SV が多数同定されており (Collins et al. Nature 2020)、コホート規模の拡大が新たな機能的 SV 発見につながることが示された。
所見2:ヒト特異的SVによる脳神経新生の変化 — ネオテニーへの収斂:
3つの独立したヒト特異的 SV がそれぞれ異なる分子機序でヒト大脳新皮質の拡大に寄与し、いずれも「神経発生の遅延」というネオテニー (neoteny; 幼形成熟) の原理に収斂することが示された (Figure 2 参照)。SRGAP2 (SLIT-ROBO Rho-GTPase-activating protein 2) 遺伝子は不完全重複を3段階 (3.4/2.4/1 百万年前) で経て機能的パラログ SRGAP2C を生成し、SRGAP2C は SRGAP2A とヘテロダイマーを形成してホモダイマー形成を阻害することで、デンドリティックスパイン (dendritic spine; 神経接続を担う棘突起) の成熟を遅延させスパイン密度を増大させ、ヒト新皮質の高い神経可塑性を実現する。ARHGAP11B は ARHGAP11A の部分重複に由来し、フレームシフトにより独自の C 末端配列を獲得した結果 RhoGAP 活性を失い、代わりに大脳皮質基底前駆細胞 (basal progenitor) を増幅する新機能を持つ; フェレット脳への導入で皮質拡大が、マーモセット脳への導入で皮質 folding が誘導されることが確認された。NOTCH2NL (ヒト特異的3パラログ: NOTCH2NLA/B/C) は NOTCH2 の部分重複から生じた偽遺伝子が遺伝子変換で再活性化されたもので、マウス・ヒトオルガノイドで神経分化を遅延させ皮質ニューロン数を増加させる。加えて、60-kb 欠失がアンドロゲン受容体 (AR; androgen receptor) 遺伝子近傍の調節領域を除去し、チンパンジーにある陰茎棘・触覚毛が消失したという解剖学的変化も SV に起因する。これら3遺伝子はすべて「阻害・遅延」のメカニズムで機能し、ネオテニー的な発達パターンを通じてヒト脳の大型化と可塑性を実現した点で注目される。
所見3:感染症への集団特異的適応 — 自然選択下の4例:
HBA1/HBA2 (alpha-globin genes; α-グロビン遺伝子) の NAHR 由来の欠失アレルはサハラ以南アフリカで最大 20% の頻度で維持され、Plasmodium falciparum 重症マラリアに対してバランス選択が働く (Table 1 参照)。グリコフォリン DUP4 (Dantu バリアント; 4q31.2) は GYPA (glycophorin A)・GYPB (glycophorin B)・GYPE (glycophorin E) を含む 120-kb タンデム繰り返しに由来する複合重複で、東アフリカに限局し重症マラリアに対して odds ratio 0.50-0.72 の保護効果を示す (Figure 3C/D 参照)。DUP4 は GYPB-GYPA 融合タンパク質を赤血球表面に発現させ、赤血球膜の表面張力を変化させることで Plasmodium merozoite の赤血球侵入を阻害する; EHH (extended haplotype homozygosity; 拡張ハプロタイプ相同性) 検定で強い正の選択シグナルが確認された。SIGLEC14 (sialic acid-binding immunoglobulin-type lectin 14) の欠失アレルは中国人で 90%・北欧人で 10% という著しい集団差を示し、B 群連鎖球菌感染への感受性を高める一方、COPD (chronic obstructive pulmonary disease; 慢性閉塞性肺疾患) 増悪リスクを低下させるトレードオフがあり、炎症応答のバランスが選択圧を形成していると考えられる。DMBT1 (deleted in malignant brain tumors 1) の SRCR (scavenger receptor cysteine-rich; スカベンジャー受容体システインリッチ) ドメイン mCNV (8p23.1) はバランス選択のシグナルを持ち、コピー数に応じた細菌 (Streptococcus mutans) 結合能の差が歯牙う蝕リスク変動と関連する。
所見4:食事適応 — AMY1 コピー数変異とデンプン消化の強化:
唾液アミラーゼ AMY1 (salivary amylase 1; 唾液アミラーゼをコードする遺伝子) のコピー数は集団内で 2-18 コピーの幅広い変動を示す (Table 1 参照)。高デンプン食集団では狩猟採集民と比較して高いコピー数が観察され、アーキックゲノム (ネアンデルタール) およびチンパンジーゲノムでは AMY1 コピー数が1であることから、高コピー数への選択は農耕開始後 (<1 万年前) に生じた比較的新しい適応と考えられる。AMY1 の高コピー数は唾液アミラーゼ活性の増加に直結するが、変動の説明分散は一部にとどまる。膵臓アミラーゼ AMY2A (pancreatic amylase 2A; 膵臓アミラーゼをコードする遺伝子; 0-4 コピー) コピー数も AMY1 と正の相関を示し、デンプン消化の多段階的強化が選択されてきたことが示唆される。同様の収斂進化として、イヌの AMY2B コピー数増加 (オオカミとの比較) が家畜化との対応を示しており、食性変化がアミラーゼ遺伝子の独立した正の選択をもたらした例として挙げられる。KANSL1 (KAT8 regulatory NSL complex subunit 1; 17q21.31) の逆位+重複は生殖能力 (fecundity) に関与する正の選択、BOLA2 (bolA family member 2; 16p11.2) の mCNV は鉄恒常性に関する正の選択シグナルを持ち、食事・代謝関連 SV の適応的意義を示す。
所見5:古代ホモニンからのSV浸透と適応的浸透の証拠:
現代人ゲノムの約 2% がネアンデルタール由来であることが確立されており (Prufer et al. 2014)、SV もその一部として浸透している。デニソワ由来として最大の事例は染色体16の複合重複 (~225 kb) で、オセアニア集団で >80% の高頻度で固定している (Figure 2A の系統樹参照)。この複合重複は約40万年前にデニソワ系統で生じ、約4万年前の浸透によりヒト遺伝子プールに入ったと推定され、現在同定された最大の浸透遺伝子座である。ネアンデルタール由来の 8p21.3 欠失はオセアニア集団で 44% の頻度で存在し、TNFRSF10D (tumor necrosis factor receptor superfamily member 10D; デスレセプター、ウイルス感染細胞のアポトーシスに関与) の発現低下をもたらす。これはウイルス免疫応答に対する適応的浸透 (adaptive introgression) を示す証拠として注目される。アーキック SV の機能的解析はロングリードシークエンシングと FISH 実験で進められているが (Figure 3A/B 参照)、多くの浸透遺伝子座の適応的意義は依然未解明で、機能的研究が求められている。HPRC の多様なゲノムアセンブリにより、ペリセントロメア領域のアーキック SV の網羅的同定が今後加速すると期待される。
考察/結論
本レビューは、SV が「中立的な量的変化」を超え、脳の認知機能向上・感染症・食事への適応というヒト進化の多様な場面で適応的役割を果たしてきたことを体系化した。Prufer et al. (2014) や Meyer et al. (2012) が確立したアーキックゲノム解析の基盤に立ちながら、SV という新たな次元でアーキック浸透の機能的意義を評価した点が本レビューの革新的な貢献である。
先行研究との相違 (これまでの研究と異なる点): 先行するゲノム研究が主として SNV を対象としてきたのに対し (Simonti et al. Science 2016 のネアンデルタール SNV と表現型の研究、Huerta-Sanchez et al. Nature 2014 のデニソワ EPAS1 SNV によるチベット人高地適応など)、本レビューは SV が進化に果たす独自の役割を体系的に論じる点で異なる。特に、SRGAP2C・ARHGAP11B・NOTCH2NL という3つの独立したヒト特異的 SV がいずれも「神経新生の遅延」というネオテニーの論理に収斂するという統合的解釈は先行研究にはなく、本稿で初めて明示された。グリコフォリン DUP4 の赤血球膜表面張力メカニズム (Kariuki et al. Nature 2020) は、融合タンパク質が物理的性質変化を介してマラリア抵抗性をもたらすという従来想定されなかった経路を示した点でも既報と異なる。
本研究の新規性 (本研究で新たに示されたこと): ロングリードシークエンシングにより「ショートリードで70%を見逃していた」という定量的転換が初めて明確化され、これまで適応性なしと判断されていた SV の再評価が迫られた。特にペリセントロメア領域の複雑な SV は依然として解析困難で、新たなヒト特異的 SV の発掘が今後期待される。SLiM 等の前向きシミュレーションは染色体長変動を許容しないため SV 専用の集団遺伝学的シミュレーション手法が必要であるが、これまでにない新しい計算手法の枠組みが本レビューで提案された。
臨床応用への示唆: 臨床応用として、BRCA1 欠失・重複がある集団では遺伝性乳がん原因変異の最大 40% を占めるなど、SV は医療遺伝学的にも重要である (clinical implication)。染色体 16p11.2 の大型欠失・重複は BMI 鏡像表現型を示し、発達遅延や神経芽腫のリスクとも関連する。SIGLEC14 欠失が COPD 増悪リスクを低下させるという知見は、炎症制御に関与する遺伝的変異として臨床的含意を持つ。ロングリード技術の普及により臨床遺伝学的診断における SV 検出の感度が大幅に向上することが期待され、bench-to-bedside の橋渡し研究が加速するであろう。
残された課題と今後の研究方向性: 残された課題として、(1) UK Biobank などの大規模コホートでの SV-表現型関連解析が未実施で代表性が低い集団での研究が求められる、(2) ヒト-チンパンジー多能性幹細胞モデルや祖先型バリアント導入ヒト細胞を用いた SV 機能解析の方法論的課題、(3) デニソワ・ネアンデルタール由来浸透 SV の大多数で機能的意義が未解明であることが挙げられる。今後の研究方向 (future research directions) として、telomere-to-telomere アセンブリによるペリセントロメア領域 SV の網羅的同定、適応的浸透を受けた SV の機能的検証 (FISH・ロングリードアセンブリ・オルガノイドモデル)、および SV 集団遺伝学の新たな計算手法の開発が重要となる。本レビューは クローン進化 の観点から SV の役割を理解する枠組みを提供し、ゲノム不安定性 研究への接続点としても重要な基盤文献である。また クロモスリプシスと ecDNA など cancer における大規模 SV との比較によって、進化と疾患を統合的に理解することが今後の課題として提示されている。
方法
レビュー論文 (PMID: 34284881、PubMed (Public Medical literature database)・MEDLINE のゲノム・進化・集団遺伝学領域の文献を体系的に統合)。以下の大規模データセットを包括的にレビューした: 1000 Genomes Project (n = 2,504 個体、26 集団、中程度カバレッジ ~7.4X)、HGDP (n = 911 個体、54 集団)、HGSVC (n = 32 二倍体ゲノム、ロングリード解析)、HPRC (テロメア-テロメアアセンブリ多数)、Simons Genome Diversity Project (n = 300 ゲノム、142 集団)。文献から得られた各 SV の集団遺伝学的証拠として、Vst (集団間頻度分化指数; Fst のアナログ)・K 統計 (McDonald-Kreitman 検定の類縁)・EHH (extended haplotype homozygosity; 拡張ハプロタイプ相同性) 検定・Fisher’s exact test による集団頻度差の有意性検定・ANOVA に基づく遺伝子発現との相関解析を用いた正の選択・バランス選択シグナルを評価した。NAHR (non-allelic homologous recombination; 非アレル相同組換え) による CNV 形成機序、FISH (fluorescence in situ hybridization; 蛍光 in situ ハイブリダイゼーション) による構造解析も横断的に統合した。さらに SRGAP2 (SLIT-ROBO Rho-GTPase-activating protein 2)・ARHGAP11B (Rho GTPase-activating protein 11B)・NOTCH2NL・AMY1・グリコフォリン・SIGLEC (sialic acid-binding immunoglobulin-type lectin) ファミリー・DMBT1 (deleted in malignant brain tumors 1) の機能的研究を横断的に統合した。