• 著者: Henn BM, Botigué LR, Bustamante CD, Clark AG, Gravel S
  • Corresponding author: Brenna M. Henn (Stony Brook University)
  • 雑誌: Nature Reviews Genetics
  • 発行年: 2015
  • Epub日: 2015-05-12
  • Article種別: Review
  • PMID: 25963372

背景

次世代シーケンシング技術の劇的な進歩に伴い、ヒトゲノムに存在する数百万もの遺伝子変異が同定され、その中にはタンパク質の機能や個体の適応度に悪影響を及ぼす有害変異が多数含まれていることが明らかになった。集団遺伝学において、これらの有害変異が集団全体の平均適応度を低下させる効果は「変異負荷 (mutation load)」として定義され、古くから理論的な研究が進められてきた。特に、Motoo Kimura による分子進化の中立説や、Tomoko Ohta によるほぼ中立説 (nearly neutral theory) は、遺伝的浮動と自然選択の相互作用が有害変異の運命をどのように決定するかを説明する基礎理論を提供した。

しかし、アフリカ外への移住に伴う深刻な人口ボトルネック (アウトオブアフリカ) が、現代の非アフリカ系集団 (ヨーロッパ系やアジア系など) の変異負荷にどのような影響を与えたかについては、研究者間で意見が大きく分かれており、長年にわたりcontroversial (議論百出) な状態が続いていた。Lohmueller et al. (2008) などの先行研究は、ボトルネックによる有効集団サイズの縮小が浄化選択の効率を低下させ、非アフリカ系集団において有害変異の割合を増加させたと報告した。これに対し、Simons et al. (2014) などの研究は、個人あたりの有害変異の総数は集団間でほぼ一定であり、人口動態史は変異負荷にほとんど影響を与えないと主張した。

このような集団間の変異負荷の差異に関する評価は、使用する統計指標や、有害変異の優性度 (dominance coefficient, h) および選択係数 (selection coefficient, s) に関する仮定に強く依存している。しかし、これまでの研究においては、これらのパラメータが変異負荷の推定に与える影響を包括的に整理した理論的・実証的な枠組みが不足していた。また、ゲノムデータから得られる実証的観察と、数理モデルが予測する理論的数値との間には、依然として大きなknowledge gap (知識のギャップ) が残されていた。本レビューは、これらの論争を整理し、ヒト集団における変異負荷の正確な理解を促すために執筆された。先行研究として、Morton et al. (1956) による consanguineous marriages (近親婚) データを用いた致死相当量の推定や、Li et al. (2008) による世界規模の遺伝的多様性の解析、さらに Nature 2012 などの大規模プロジェクトが挙げられる。

目的

本レビューの主な目的は、ヒトゲノムにおける変異負荷、特に有害およびほぼ中立なアレルの蓄積量を推定するための理論的枠組みと実証的アプローチを体系的に整理することである。また、アウトオブアフリカボトルネック、連続創始者効果 (serial founder effects)、および農業革命以降の急激な人口増加といったヒトの人口動態史が、集団間の変異負荷パターンに与える影響について、これまでの科学的論争を公正に評価・整理することを目的とする。さらに、変異負荷の評価において極めて重要であるにもかかわらず、これまでゲノム規模での推定が困難であったドミナンス係数 (h) や選択係数 (s) の仮定が、集団間の負荷の差異に関する結論にどのような劇的な変化をもたらすかを定量的に示す。最終的に、変異効果予測アルゴリズムの現状の限界を指摘し、今後の集団遺伝学およびゲノム医療における研究の方向性を提示することを目的とする。

結果

中立理論とほぼ中立説の数理的基礎: 分子進化の中立理論によれば、集団内に維持される遺伝的多様性や固定に至る変異の大部分は選択的に中立であり、遺伝的浮動によってその運命が決定される。ヘテロ接合度 (θ) は、有効集団サイズ (Ne)、塩基多様性、および中立変異の割合 (f) の積 θ = 4Neμf として記述される。Ohtaのほぼ中立説はこれを拡張し、選択係数 (s) が |s| << 1/Ne の範囲にある弱有害変異は、集団サイズが小さい場合には中立アレルと同様に振る舞い、遺伝的浮動によって集団内に蓄積・固定しやすくなると予測した。変異負荷 (L) は、理論上の最大適応度 (Wmax) と集団の平均適応度 (Wmean) の差 L = (Wmax - Wmean)/Wmax として定義される。無限集団における平衡状態 (mutation-selection balance) では、一座位あたりの変異負荷は選択係数 (s) に依存せず、突然変異率 (μ) のみによって決定されるが、有限集団においては遺伝的浮動の影響により、弱有害変異 (ほぼ中立変異) が集団全体の変異負荷を増加させる主要な要因となることが示されている。

有害変異の分類とアレル頻度分布の特徴: 1000人ゲノムプロジェクト(Nature 2012)のエクソームデータ(n=1,092 genomes)を用いた解析により、個人ゲノム内に存在する有害変異の分布パターンが明らかになった。ナイジェリアのヨルバ人である YRI (Yoruba in Ibadan, Nigeria: ナイジェリア・イバダンのヨルバ人集団) を対象とした解析では、個人のゲノムに存在する有害SNPの約70%は、アレル頻度である MAF (minor allele frequency: マイナーアレル頻度) が5%以上の共通変異で占められていることが示された (Fig 1)。これに対し、GERPスコアが4以上の「大効果」を持つ高度に有害な変異は、その約50%がMAF 5%未満の稀少変異に濃縮されており、強力な浄化選択がこれらの変異の頻度上昇を抑制している現実を反映している。また、既報のエクソーム解析(n=3,281 individuals)では、検出された全塩基変異の約47%が有害であると予測され、これらの稀少有害変異の蓄積が、個人の複合疾患に対する感受性や表現型の多様性に深く関与していることが示唆されている。

Lohmueller et al. と Simons et al. の論争と統計指標のバイアス: ヒト集団間における変異負荷の差異の有無を巡っては、Lohmueller et al. (2008) と Simons et al. (2014) の間で極めて重要な論争が展開された。Lohmuellerらは、n=15 individuals のアフリカ系アメリカ人と n=20 individuals のヨーロッパ系アメリカ人の常染色体データを比較し、ヨーロッパ系において有害変異の「割合」が有意に高い(ヨーロッパ系16% vs アフリカ系12%, p<0.05)ことを示した。この結果は、アウトオブアフリカボトルネックに伴う有効集団サイズの縮小が、浄化選択の効率を低下させた証拠であると解釈された。しかし、Simonsらは「個人あたりの有害変異数」を統計指標とした場合、ヨーロッパ系とアフリカ系の間に有意な差が認められないことを実証した。この一見矛盾する結論は、統計指標の選択バイアスに起因する。非アフリカ系集団ではボトルネックにより多くの変異が固定(derived homozygotes)している一方、アフリカ系集団では豊富な稀少変異(heterozygotes)が存在するため、個人あたりの総アレル数としてカウントすると両集団間で均衡(差が約1.5%未満)していることが、アレル頻度分布である SFS (site frequency spectrum: 部位頻度スペクトル) の比較解析により明らかになった (Fig 2)。比較された集団には、東京の日本人集団である JPT (Japanese in Tokyo, Japan)、イタリア・トスカーナ人集団である TSI (Tuscans in Italy)、ロサンゼルス在住メキシコ系集団である MXL (Mexican Ancestry in Los Angeles, California) などが含まれる。

アウトオブアフリカボトルネックのシミュレーション解析: ボトルネックが変異負荷に与える動的な影響を定量的に評価するため、様々な人口動態シナリオに基づくフォワードシミュレーションが実施された。Simonsらが構築したボトルネックモデル(有効集団サイズが一時的に 10-fold 減少するシナリオ)では、ボトルネックの直後には遺伝的浮動によって多くの変異が消失するため、一時的に有害変異の総数が減少する。しかし、その後の集団回復期(指数関数的拡大期)において、新規の稀少有害変異が急速に蓄積し、全体の負荷はボトルネック前の水準へと速やかに回帰する。これは「opposing forces(反対方向の力の均衡)」として定義され、ボトルネックによる変異の物理的喪失と、生存した変異の頻度上昇および新規変異の流入が相殺し合う動態を示す。一方、Fu et al. (2014) のシミュレーションでは、10-fold から 15-fold のボトルネックを経た集団において、定常集団と比較して約4.5%の変異負荷の有意な増加が予測された。この増加分の大部分は、選択係数が極めて小さい(s = -1 × 10^-4)弱有害変異が、ボトルネック時の強い遺伝的浮動によって集団内に固定されたことに起因することが解析された (Fig 4)。

連続創始者効果と拡大負荷の動態: 人類がアフリカ大陸からユーラシア、オセアニア、およびアメリカ大陸へと拡散する過程では、段階的な集団の分岐と移動を伴う「連続創始者効果」が強く作用した。Peischl et al. (2013) が実施した空間的フォワードシミュレーションでは、拡大する集団の波頭 (wave front) において極端な遺伝的浮動が発生し、有害変異が急速に高頻度化・固定する「遺伝的サーフィン (allelic surfing)」現象が示された。この結果、地理的拡大の末端に位置する集団ほど、適応度が低下する「拡大負荷 (expansion load)」を抱えることになる。この効果は、キャリング・キャパシティ (K) が約1,000人規模の創始者集団を仮定した場合に特に顕著であり、選択係数が s = -0.01 程度の有害変異であっても、波頭での強い浮動によって容易に固定に達することが実証されている (Fig 2a)。また、アフリカと非アフリカ集団の間で共有される共通変異の約10%が有害と予測され、フィンランド人集団などの隔離集団では、大効果を持つ有害変異の約14%が共有され、そのうち約86%が高頻度化している現実が明らかになった。

急激な人口増加と稀少変異の過剰蓄積: 農業革命 (約1万年前) 以降、ヒト集団は爆発的な人口増加を経験した。Coventry et al. (2010) や Tennessen et al. (2012) などの大規模シーケンシング研究(n=10,000超のサンプル)では、定常集団モデルの予測と比較して、シングルトン変異が約5-fold過剰に存在することが示され、急激な人口増加の遺伝的証拠が得られた。人口増加は、新規に発生した稀少変異の生存期間を延長させる一方で、それらの変異が低頻度にとどまるため、個人の変異負荷への影響は限定的である。アフリカ系集団 (特にバントゥー語族の拡散に伴うサブサハラ集団) でも過去5,000年間に急激な人口増加が起きており、これらの集団も稀少変異の蓄積という点では非アフリカ系と類似した動態を示す。

ドミナンス係数の仮定がもたらす変異負荷評価の劇的変化: 変異負荷の集団間差異を評価する上で、最も重要なパラメータはドミナンス係数 (h) である。加法モデル (h = 0.5) を仮定した場合、集団間の変異負荷の差はわずか約1.5%程度にとどまるが、完全劣性モデル (h = 0) を仮定すると、非アフリカ系集団 (JPT、TSI、MXLなど) の変異負荷がアフリカ系集団 (YRI) よりも有意に高くなる (Fig 4)。これは、ボトルネックを経た集団において、遺伝的浮動によって有害変異がホモ接合型 (derived homozygotes) として固定される確率が高まるためである。モデル生物を用いた突然変異蓄積実験からは、有害効果が重篤な変異ほどより劣性 (h → 0) であるという逆相関が観察されており、ヒトゲノムにおける適応度効果分布である DFE (distribution of fitness effects) や、ホモ接合連続領域である ROH (runs of homozygosity) 内の有害変異の濃縮度を考慮したドミナンス係数の分布の正確な推定が、今後の変異負荷研究における最重要課題であることが示された。実際に、健康な個人の約45%が少なくとも1つの重篤なメンデル遺伝病の劣性アレルをヘテロ接合型で保有していることが報告されている。

変異効果予測アルゴリズムの精度と局所適応の誤分類: GERP、PolyPhen、PhyloPなどの複数のアルゴリズムを比較した場合、変異の有害性予測における一致度は中程度 (moderate concordance) にとどまる。これらのアルゴリズムは、系統的保存度やタンパク質構造への影響に基づいてスコアを算出するため、実際には特定の環境において適応的 (有益) である変異を有害と誤分類するリスクがある。例えば、東アジア集団において汗腺密度の増加や毛髪の太さに関連する適応的変異である EDAR-V370A (ectodysplasin A receptor V370A変異) は、計算上は有害と予測される。このような誤分類は、集団間の変異負荷の比較において偽陽性を生じさせる要因となり、アルゴリズムの精度向上のためには、高スループットな機能的実験データとの統合が不可欠である。さらに、高地環境における貧血児の肺炎リスクが約4-foldに達するような環境依存的な適応度変化も、一律のスコアリングを困難にする要因となっている。

考察/結論

本レビューは、ヒトゲノムにおける変異負荷の理論的・実証的枠組みを精緻に整理し、集団間比較をめぐる長年の論争に対して極めて客観的かつ体系的な視点を提供した。

先行研究との違い: 本研究は、単に特定の集団間で変異負荷に差があるか否かを論じた従来の個別研究と異なり、ドミナンス係数 (h) や選択係数 (s) の分布、および統計指標の選択が結論に与える影響を包括的かつ数理的に整理した点で大きく異なる。従来の論争 (Lohmueller et al. と Simons et al. の対立) が、使用する統計指標 (割合 vs 個人あたりのアレル数) の違いに起因する見かけ上の矛盾であったことを明確に示した。

新規性: 本研究は、加法モデル (h = 0.5) と劣性モデル (h = 0) における変異負荷の挙動を体系的に比較し、ボトルネックを経た非アフリカ系集団において劣性有害変異がホモ接合化することで実質的な変異負荷 (expressed load) が著しく増加することを、実際のゲノムデータを用いて本研究で初めて明確に示した。これにより、人口動態史が変異負荷に与える影響の評価には、優性度の仮定が決定的な役割を果たすことが浮き彫りになった。

臨床応用: 本知見は、集団特異的な稀少有害変異が複合疾患リスクに与える影響を解明する上での重要な基盤となり、ゲノム医療や創薬ターゲットの選定における臨床的意義が極めて高い。特に、近交系集団や隔離集団における劣性遺伝病の予測や、個別化医療の最適化への臨床応用が期待される。また、特定の集団で高頻度化した有害変異の同定は、集団特異的な疾患感受性の理解に直接貢献する。

残された課題: 今後の検討課題として、非コード領域における有害変異の同定、エピスタシス (遺伝子間相互作用) 効果の定量化、および高スループットな機能実験によるドミナンス係数の直接的な推定が残されている。また、局所適応アレルを有害変異と誤分類するアルゴリズムの限界を克服することも、今後の重要な研究方向性である。これらの課題を解決することで、ヒト集団における変異負荷の生物学的・医学的意義がより正確に評価されることが期待される。

方法

本論文は、ヒト集団遺伝学における変異負荷の理論と実証データを統合した包括的なレビューである。文献の選定にあたっては、PubMed および Google Scholar などの主要な学術データベースを用い、ヒトゲノムにおける有害変異、人口動態史、浄化選択の効率、および変異負荷の推定に関連するピアレビュー済みの論文を網羅的に検索・抽出した。

実証的データの解析手法として、Nature 2012 が提供する1000人ゲノムプロジェクトのフェーズ1データや、EVS (Exome Variant Server) などの大規模エクソームシーケンシングデータから得られたアレル頻度分布 (SFS: site frequency spectrum) の解析結果を比較検討した。

理論的枠組みの整理においては、Kimuraの中立説に基づくヘテロ接合度 (θ = 4Neμf) の数理モデルや、変異負荷 (L = (Wmax - Wmean)/Wmax) の古典的定義を再評価した。集団間の変異負荷を比較するために用いられてきた様々な統計指標 (個人あたりの有害アレル数、ホモ接合体数、有害変異の割合など) の数理的な性質と、それらがもたらすバイアスについて整理した。

さらに、人口動態史が変異負荷に与える影響をシミュレーションした先行研究 (Lohmueller et al., Simons et al., Fu et al., Peischl et al. など) のフォワードシミュレーション (forward simulation) アプローチを詳細に分析した。これらのシミュレーションにおいて設定された有効集団サイズ (Ne) の変動モデル、ボトルネックの期間 (T) および強度、選択係数 (s) の分布 (DFE: distribution of fitness effects)、およびドミナンス係数 (h) の仮定を比較した。

統計的検定手法としては、アレル頻度の比較に用いられる Mann-Whitney U検定や、変異の割合の比較に用いられる Fisher's exact 定義などの適用例を評価した。また、変異の有害性を予測するために広く用いられているアルゴリズム、すなわち GERP (genomic evolutionary rate profiling)、PolyPhen、SIFT、PhyloP などの予測原理、スコアリング基準、およびそれらの一致度 (concordance) について体系的な比較を行った。