• 著者: Sun BB, Maranville JC, Peters JE, Stacey D, Staley JR, Blackshaw J, Burgess S, Jiang T, Paige E, Surendran P, Oliver-Williams C, Kamat MA, Prins BP, Wilcox SK, Zimmerman ES, Chi A, Bansal N, Spain SL, Wood AM, Morrell NW, Bradley JR, Janjic N, Roberts DJ, Ouwehand WH, Todd JA, Soranzo N, Suhre K, Paul DS, Fox CS, Plenge RM, Danesh J, Runz H, Butterworth AS
  • Corresponding author: Danesh J (University of Cambridge); Butterworth AS (University of Cambridge)
  • 雑誌: Nature
  • 発行年: 2018
  • Epub日: 2018-06-06
  • Article種別: Original Article
  • PMID: 29875488

背景

血漿タンパク質はシグナル伝達・物質輸送・成長促進・免疫防御など生体の中枢的プロセスを担い、承認済み薬剤の多くが直接の作用標的として血漿タンパク質を持つ。血漿タンパク質量には個体間で著しい変動が観察され、その一部が遺伝的要因で規定されることは双生児研究 (Liu et al. 2015) で示唆されていたが、血漿プロテオームの遺伝的制御を網羅的に捉えた研究は規模・プラットフォームの制約から大きく限られていた。先行の pQTL (protein quantitative trait locus: タンパク質量定量的形質遺伝子座) 研究として、Suhre et al. 2017 は血漿タンパク質の遺伝的変異との関連を数百タンパク質で報告し、de Vries et al. 2017 は全ゲノムシーケンシングで血清ペプチドレベルの遺伝的関連を検討したが、対象タンパク質数が数百にとどまり、trans (遠隔制御) の全容は未解明のままであった。より古典的な GWAS (genome-wide association study: ゲノムワイド関連解析) は何千もの疾患感受性遺伝子座を同定してきたが、どの血漿タンパク質を介して表現型が変化するかを系統的に解明した研究は存在しなかった。

この知識のギャップが「遺伝子座 → タンパク質 → 疾患」という分子経路の解明と、メンデリアンランダム化 (MR: Mendelian randomization) による因果推論の実施を妨げていた。MR 解析はゲノム変異を操作変数として交絡・逆因果を排除し、タンパク質の疾患への因果役割を推論する強力な手法であるが (Burgess et al. 2015)、適切な遺伝的操作変数 (genetic instrument) が限られていたことが適用の大きな障壁であった。SOMAscan (Slow Off-rate Modified Aptamer scan) プラットフォーム (SomaLogic 社、3,000 種以上のタンパク質を同時定量; Rohloff et al. 2014) の登場により技術基盤が整いつつあったが、大規模健常者コホートへの適用と全ゲノムとの統合的解析は実施されておらず、何が足りなかったかとして「数千タンパク質規模の pQTL アトラスとそれを用いた疾患-タンパク質-ゲノム統合解析基盤」の欠如が核心的な課題であった。

目的

英国血液ドナーコホート INTERVAL (Interval randomised trial of blood donation) 研究 3,301 人を対象に、SOMAscan (3,622 タンパク質対応) と全ゲノムシーケンシングを統合した包括的 pQTL アトラスを構築すること。英国 NHS (National Health Service) 血液ドナー 5 万人のサブセットである。疾患 GWAS シグナルとの重複解析および MR 解析を通じて、疾患の分子メカニズム解明と治療標的同定に活用すること。

結果

pQTL アトラスの規模と新規性:既報の 4 倍の遺伝子座を同定:有意水準 p<1.5×10⁻¹¹ のゲノムワイド解析 (n=3301 individuals; INTERVAL (Investigating Novel Traits from Evaluating Randomly Assigned Volumes And Logistics; 英国 NHS 献血者ランダム化試験コホート) 参加者、SOMAscan (Slow Off-rate Modified Aptamer scan; SomaLogic 社アプタマー型多重プロテオーム測定プラットフォーム) で 2,994 タンパク質を測定) で 1,478 タンパク質に対して 1,927 の有意な pQTL 遺伝子座を 764 のゲノム領域で同定した (89% が新規; 既報の 4 倍に相当)。条件付き解析で 2,658 の独立した有意関連が存在し、cis pQTL (549 関連; 28%) と trans pQTL (1,104 タンパク質) に分布した。cis アソシエーションの sentinel variant (最強の関連変異) の 95% が遺伝子 TSS (transcription start site: 転写開始点) から 200 kb 以内、87% が 100 kb 以内、44% が遺伝子内に位置した。Olink PEA (proximity extension assay) による独立複製 (n=4998 individuals; 163 pQTL を試験) では全体複製率 65% (cis 81%、trans 52%)、SOMAscan と Olink 間の効果量の Pearson r=0.83 が確認された (Extended Data Fig. 3c)。

pQTL の遺伝的効果量と機能的注釈:各タンパク質量変動を説明する分散の中央値は 5.8% (IQR (interquartile range: 四分位範囲) 2.6〜12.4%)。193 タンパク質では単一 pQTL が 20% 超の分散を説明した。最強の 36 関連 (効果量 >1.5 SD (standard deviation: 標準偏差)) のうち 29 は希少 (MAF (minor allele frequency: マイナーアレル頻度) <1%) または低頻度変異 (MAF 1〜5%) によるものであり、希少変異が強い個体差を規定することが示された。cis および trans pQTL 共にミスセンス変異 (p<0.0001)、3’ 非翻訳領域 (3’UTR; p=0.0025)、スプライスサイト (p=0.0004) で有意に濃縮した (Fig. 1g)。さらに血液細胞の転写活性化マーカーと肝細胞制御エレメントで少なくとも 3 倍の濃縮 (p<5×10⁻⁵) が確認され、肝臓のタンパク質合成・分泌における中心的役割と一致した。

trans pQTL ホットスポットとマスターレギュレーター:SERPINA1 Z-allele の多面的効果:trans pQTL ホットスポット解析で、SERPINA1 (serpin family A member 1) 遺伝子の Z-allele (rs28929474:T; A1AT (alpha-1 antitrypsin: アルファ-1アンチトリプシン) 欠乏症原因変異) が p<1.5×10⁻¹¹ で 13 種のタンパク質に対して trans pQTL として機能した (さらに p<5×10⁻⁸ で 6 種) (Fig. 2)。A1AT は主要なプロテアーゼ阻害剤であり、Z-allele 保因者では循環 A1AT 量が低下し PR3 (proteinase-3: プロテイナーゼ-3) の遊離状態が増加する。PRTN3 座位の cis pQTL (rs7254911) と SERPINA1 Z-allele による trans pQTL の 2 つの独立した遺伝的メカニズムがいずれも PR3 の利用可能性を増加させ、AAV (ANCA-associated vasculitis: 抗好中球細胞質抗体関連血管炎) リスクを高めることが示された (Fig. 4c)。trans ホットスポット 12 領域が 20 以上のタンパク質と関連し (ABO・CFH・APOE・KLKB1 等)、単一遺伝子座が複数タンパク質の協調的制御を担うマスター調節ネットワークの存在が遺伝学的に実証された。

疾患遺伝子座との重複とメンデリアンランダム化による因果推論:88 pQTL 遺伝子座 (r²≥0.8) が既報の疾患 GWAS 感受性シグナルと重複し、コロカリゼーション解析 (MHC (major histocompatibility complex: 主要組織適合性遺伝子複合体) 領域外 108 遺伝子座-疾患ペアのうち 96/108 で PP>0.8) で共通の因果変異が示唆された。MR 解析の主要結果として: (1) MMP-12 の多アレル遺伝スコア (分散の 14% を説明) が CHD (coronary heart disease: 冠動脈疾患) リスクの有意な低下と関連した (p=2.8×10⁻¹³; Fig. 5b)。観察研究での MMP-12 高値→心血管イベント増加という知見と逆の関係は、観察研究における交絡の存在を示唆する重要な不一致である。(2) IL18R1 (interleukin-18 receptor 1) と IL1RL2 の遺伝スコアがアトピー性皮膚炎リスクと強く関連: IL18R1 univariable p=9.3×10⁻⁷²→相互調整後 p=1.5×10⁻²⁸; IL1RL2 univariable では隠れていたが調整後 p=1.1×10⁻⁶⁹ (Fig. 5a)。(3) PSP94 (prostate secreted protein 94) / MSMB 低発現関連 pQTL が前立腺癌感受性と関連し、PSP94 の保護的役割を支持した。

創薬標的同定とドラッグリポジショニング:244 タンパク質 (17%) が Informa Pharmaprojects データベースで既承認薬の標的として記録され、このうち 31 pQTL が疾患シグナルと高確率にコロカライズした (PP>0.8)。IBD (inflammatory bowel disease: 炎症性腸疾患) リスク変異 (rs3197999:A in MST1) が PRDM1/BLIMP1 (B lymphocyte-induced maturation protein-1: 免疫細胞分化マスターレギュレーター) を含む 9 タンパク質の trans pQTL として同定され、曖昧だった IBD 遺伝子座の因果遺伝子同定に貢献した (Fig. 3)。RANK (receptor activator of nuclear factor kappa-B; TNFRSF11A にコードされる) の pQTL (rs884205) が Paget 病 GWAS シグナルとコロカライズし、RANKL 標的薬デノスマブの Paget 病への適応拡大の遺伝的根拠を提供した。GP1BA (glycoprotein Ib platelet subunit alpha: フォン・ウィレブランド因子受容体) の cis/trans pQTL が高血小板数・心筋梗塞・脳卒中 GWAS シグナルと関連し、動脈血栓症への治療標的としての支持が得られた。

考察/結論

本研究はヒト血漿プロテオームの遺伝的制御に関する史上最大規模の包括的地図を提示し、以後の PWAS (proteome-wide association study: プロテオームワイド関連研究) の基盤となった。SOMAscan により 3,622 タンパク質を同時定量し全ゲノムと統合したアプローチは、1,927 pQTL (89% が新規) という知見を可能にし、従来の質量分析法ベースや細胞株研究では到達できなかった量的・質的な飛躍を示した。764 の独立ゲノム領域で cis・trans 両方向の制御が解明されたことで、血漿タンパク質量の遺伝的決定因子の全体像がこれまでにない規模で明らかになり、本研究で初めて示された体系的な trans pQTL アトラスは既存の pQTL 研究と本質的に異なるスケールと解像度を提供する。

先行研究との比較では、本研究以前の血漿 pQTL 研究 (Suhre et al. 2017、de Vries et al. 2017 など) は最大でも数百タンパク質を対象とした小規模なものにとどまっており、本研究と大きく異なり、規模・新規性ともに従来を超えるものである。trans pQTL が 1,104 タンパク質に存在することを体系的に示したことは「cis 主体」という先入観を覆す重要な発見であり、先行研究ではこの全容が未検討であった。SERPINA1 Z-allele/A1AT 欠乏/PR3 超発現/血管炎という病態軸は trans pQTL の機能的ネットワーク実例として高い説明力を持つ。MR 解析で MMP-12→CHD 保護効果 (p=2.8×10⁻¹³) は観察研究との逆説的乖離を示しており、治療標的評価における メンデリアンランダム化 解析の優位性を示す典型例となっている。

臨床的含意として、pQTL-GWAS 重複と MR を組み合わせた「遺伝的バリデーション」アプローチは前臨床段階での標的優先順位付けに直接活用でき、デノスマブ (RANKL 標的抗体、Paget 病) や PCSK9 (proprotein convertase subtilisin kexin 9) 阻害薬 (LDL/CHD) など実際の承認薬との一致事例が枠組みの内部妥当性を保証した。がん領域では、腫瘍微小環境や 液体生検 に関連する血漿バイオマーカーの遺伝的制御基盤の理解が新視点を提供する。残された課題として、SOMAmer の交差反応性問題 (126/920 のアプタマーで類似タンパク質への結合が確認、うち半数は同タンパク質の別アイソフォーム)、trans pQTL の分子機序の個別解明、がん・自己免疫など疾患状態の血漿プロテオーム pQTL 解析 (健常者コホートで同定した制御が病態下で変化するか)、および縦断的プロテオーム変化の遺伝的追跡が挙げられる。本研究が確立した大規模プロテオームゲノミクスの枠組みは、次世代の精密医療創薬研究の基盤として広く参照され続けている。

方法

INTERVAL 研究参加者 3,301 人 (欧州系英国人献血ドナー; ISRCTN24760606; 無作為化献血頻度試験に登録された約 5 万人のサブセット; 重篤疾患歴のない健常者) に対して SOMAscan を実施し、品質基準 (CV (coefficient of variation: 変動係数) ≤20%、双方サブコホートでの一貫性) を満たした 2,994 タンパク質を解析対象とした。Affymetrix Axiom UK (United Kingdom) Biobank アレイ (約 83 万 SNP (single nucleotide polymorphism: 一塩基多型)) でジェノタイピング後、1000 Genomes Phase 3 と UK10K (United Kingdom 10000 genomes; 英国人 10,000 ゲノムプロジェクト) を組み合わせたリファレンスパネルを用いてインピュテーション (genotype imputation: 遺伝子型補完) を実施し、計 10.6 百万 SNP を解析した (品質基準: INFO (imputed novel feature score; 0〜1 のスケール) ≥0.7、マイナーアレル数 ≥8)。

ゲノムワイド解析には SNPTEST (SNP Testing software; v2.5.2) を用いた線形回帰 (加法的遺伝モデル、タンパク質量をランク逆正規化後) を採用し、2 サブコホートの固定効果メタ解析 (METAL) で統合した。有意水準は p<1.5×10⁻¹¹ (ゲノムワイド閾値 p=5×10⁻⁸ を 3,283 アプタマーで Bonferroni 補正) に設定した。段階的条件付き解析 (GCTA (genome-wide complex trait analysis) v1.25.2; cojo-slct オプション) で独立した pQTL を抽出した。cis pQTL (同一遺伝子近傍 1 Mb 以内) のアプタマー結合アーティファクト評価では、配列相同性 ≥40% のタンパク質に対して 920 SOMAmer (single-stranded DNA aptamer) を試験した。独立複製は Olink PEA (proximity extension assay: 近接延長アッセイ) プラットフォームで 4,998 人の別コホートを使用し、Bonferroni 補正後複製閾値 (p<3.1×10⁻⁴) を適用した。

pQTL-疾患 GWAS 重複解析は PhenoScanner データベース (r²≥0.8 の高 LD (linkage disequilibrium: 連鎖不平衡) で照合) を使用し、コロカリゼーション解析 (PP (posterior probability: 事後確率) >0.8 を高確率と定義) で共通因果変異の存在を評価した。MR 解析では逆分散荷重法を用い、MMP-12 (matrix metalloproteinase-12: マトリックスメタロプロテアーゼ-12) の多アレル遺伝スコア (分散の 14% を説明) や IL1RL1-IL18R1 遺伝子座の相互調整 MR を実施した。機能的注釈は GARFIELD v1.2.0 による非パラメトリック置換検定 (ENCODE・ROADMAP Epigenomics データ使用、計 998 検定) で評価した。