• 著者: Gerard Manning, David B. Whyte, Ricardo Martinez, Tony Hunter, Sucha Sudarsanam
  • Corresponding author: Gerard Manning (Sugen Inc., South San Francisco, CA, USA); Tony Hunter (Salk Institute, La Jolla, CA, USA)
  • 雑誌: Science
  • 発行年: 2002
  • Epub日: 2002-12-06
  • Article種別: Original Article
  • PMID: 12471243

背景

プロテインキナーゼ (protein kinase) はリン酸化によって他のタンパク質活性を制御する最大規模のヒト遺伝子ファミリーの一つであり、細胞増殖・分化・アポトーシス・シグナル伝達など多岐にわたる生物学的プロセスを調節する。Hanks & Hunter 1991 が「A thousand and one protein kinases」でキナーゼ触媒ドメインの配列保存性を初めて体系的に示し、触媒ドメイン配列類似性に基づく分類体系の基礎を構築した。Plowman et al. 1994 がErbBファミリーをはじめとするチロシンキナーゼの分類を進め、Bhatt & Bhatt 2002 が「Protein kinases — the major drug targets of the twenty-first century?」でキナーゼを医薬品ターゲットとして包括的に論じた。Lander et al. 2001 によるヒトゲノム配列決定完成後に全キナーゼの網羅的同定が初めて可能となった。がん・糖尿病・神経変性疾患など多数の疾患においてキナーゼの機能異常が報告されており、Bcr-Abl (ABL1融合)・EGFR等を標的とする分子標的薬の開発が急速に進んでいた。しかし、Lander et al. 2001・Venter et al. 2001 によるヒトゲノム配列決定完成まで、ヒトゲノム中に存在するキナーゼの総数と全体像は未解明であり、体系的な分類体系も存在しなかった。1991年の概算では100〜2,000個のキナーゼが存在すると予測されていたが、実証的なカタログは未検証のままであり、全キナーゼをカバーした系統樹も未整備であった。

目的

ヒトゲノム配列からすべてのプロテインキナーゼをバイオインフォマティクス的手法で網羅的に同定・注釈し、進化的系統関係に基づく包括的な分類体系「ヒトキノーム (Human Kinome)」を確立すること、および未特徴化キナーゼの機能予測基盤を提供すること。

結果

所見1:ヒトキノームの全体像 — 518キナーゼ、ヒト遺伝子全体の約1.7%: ヒトゲノム中にn=518 cases (プロテインキナーゼ遺伝子) を同定した (Figure 1)。内訳は触媒ドメイン配列が明確に同定できる典型的キナーゼ (canonical kinase) 478個、および活性が確認されているが触媒ドメイン配列の類似性が低い非典型的キナーゼ (atypical kinase) 40個である。n=518 cases はヒトタンパク質コード遺伝子全体の約1.7%に相当し、ヒトキノームの全貌を初めて確定的に示した (Table 1)。比較として、酵母 (Saccharomyces cerevisiae) には約130個、線虫 (Caenorhabditis elegans) には約454個のキナーゼが報告されており、脊椎動物でのキナーゼファミリーの顕著な拡張が示された。

所見2:7大グループへの系統的分類とグループ別特徴 — AGC・CAMK・CMGC等7グループに478個を系統分類: 典型的キナーゼ478個は触媒ドメインの配列類似性・基質特異性・系統的類似性に基づき7大グループに分類された (Figure 1)。7グループ間でのキナーゼ数の95% CI は帰属確実度の高さを反映しており、グループ内配列同一性とHMMスコアの間には正の相関 (Pearson r=0.83) が認められ、各グループ内の配列同一性は平均40-60%の範囲内に収まる傾向を示した。(1) AGC グループ (Protein Kinase A/G/C): cAMP・cGMP・DAG/カルシウムシグナルの下流エフェクター群。PKA (cAMP-dependent protein kinase)・PKG (cGMP-dependent protein kinase)・PKC (Protein Kinase C) ファミリーを含む。(2) CAMK グループ (Ca2+/calmodulin-dependent kinase): CaMK1/2/4・AMPK (AMP-activated protein kinase)・MARKファミリーを含む。(3) CMGC グループ: CDK (Cyclin-Dependent Kinase)・MAPK (Mitogen-Activated Protein Kinase)・GSK (Glycogen Synthase Kinase)-3・CLKファミリーを含む。(4) STE グループ: 酵母Ste7・Ste11・Ste20の哺乳類ホモログ (MAP2K・MAP3K・PAK等) を含む。(5) TK グループ: チロシンキナーゼ (受容体型・非受容体型)。(6) TKL (Tyrosine-Kinase-Like) グループ: RIPK・LRRK・MLK・RAF・TGFbR等。(7) CK1 (Casein Kinase 1) グループ: カゼインキナーゼ1ファミリー。残余の約100キナーゼは系統的帰属が明確でなく系統樹の中央部に配置された。

所見3:TKグループ — 受容体型・非受容体型チロシンキナーゼと発癌性キナーゼの集積: チロシンキナーゼ (TK) グループは受容体型チロシンキナーゼ (RTK) と非受容体型チロシンキナーゼに区分される。RTKには EGFR (HER1)・HER2 (ERBB2)・HER3・HER4 (ErbBファミリー)、FGFR1-4 (Fibroblast Growth Factor Receptor)、PDGFR (Platelet-Derived Growth Factor Receptor)-alpha/beta、KIT/CSFR/FLT3、VEGFR (Vascular Endothelial Growth Factor Receptor: FLT1/KDR/FLT4)、MET・RON、ALK (Anaplastic Lymphoma Kinase)・LTK、RET、Ephファミリー (EphA1-10・EphB1-6)、TIE1/TIE2、InsR・IGF1R (Insulin-like Growth Factor 1 Receptor)・IRR等が含まれる。非受容体型にはSrc・Lck・Fyn・Blk・HCK・Fgr・Lyn・Yes (Srcファミリー)、Abl・Arg (Ablファミリー)、FAK (Focal Adhesion Kinase)・PYK2、JAK (Janus Kinase) 1-3・TYK2、ZAP70・Syk、BTK・ITK・TEC・TXK・BMX (Tecファミリー)、Axl・Mer・Tyro3等が含まれる。肺癌ドライバーキナーゼ (EGFR・ALK・ROS1・RET・MET) のいずれもTKグループに属することが系統樹上で明示され、分子標的薬開発の標的マップとして機能した。

所見4:非典型的キナーゼ40個 — PIKK・Brd等7ファミリーに分類される創薬重要キナーゼ群: ABC1・Alpha・Brd・PDHK・PIKK・RIO・TIF1の7ファミリーからなる40個の非典型的キナーゼが同定された (Figure 2)。特に重要なものとして: PIKK (Phosphatidylinositol 3-Kinase-related Kinase) ファミリー (ATM: Ataxia Telangiectasia Mutated・ATR: ATM and Rad3-related・DNA-PK/DNAPK: DNA-dependent Protein Kinase・mTOR/FRAP: mammalian Target Of Rapamycin・SMG1・TRRAP) はDNA損傷応答・細胞増殖制御に中心的役割を持つ。Brd (bromodomain and kinase) ファミリー (Brd2・Brd3・Brd4・BrdT) はブロモドメイン含有キナーゼであり、BET (Bromodomain and Extra-Terminal) 阻害剤の標的として後に注目された。PDHK (Pyruvate DeHydrogenase Kinase) ファミリー (PDHK1-4・BCKDK: Branched Chain alpha-Keto acid Dehydrogenase Kinase) はミトコンドリアキナーゼで代謝制御に関与する。EEF2K (Eukaryotic Elongation Factor 2 Kinase) とAlphaキナーゼ群 (AlphaK1-3・ChaK1/2) も同定された。

所見5:約100個の未特徴化キナーゼと機能予測 — SgK番号系で管理された将来標的候補群: 系統樹の中央部に配置された約100個のキナーゼは、近縁の特徴付け済みキナーゼとの配列類似性を利用して基質特異性・生物学的機能を予測可能であることが示された (Figure 1)。SgK (Sugen kinase) 番号を付与された未命名キナーゼ群が多数含まれる。例えばSgK269・SgK071・SgK223・SgK110・SgK069等 (Table 1)。またデュアルドメインキナーゼ (b サフィックス: JAK1-3b・RSK1-4b・MSK1/2b等) が複数同定された。7グループ合計で典型的キナーゼ n=478個が体系化され、これはヒトタンパク質コード遺伝子中の約1.7%に相当し、キナーゼがヒトゲノムの中で最大規模の遺伝子ファミリーの一つであることを確認した。HMMスコアの95% CI で各キナーゼの触媒ドメイン帰属が統計的に支持され、典型的キナーゼ間の配列同一性は平均35±12%の範囲で分布した。www.kinase.comには各キナーゼの詳細な部分系統樹・配列アラインメント・ドメイン構造が無償公開された。

考察/結論

本研究はヒトキノームの初の包括的カタログを提供し、キナーゼ研究・創薬・基礎生物学の基盤となる参照データセットを確立した。ヒトゲノム配列の完成 (Lander et al. Nature 2001; Venter et al. Science 2001) を受けて初めて全キナーゼの網羅的同定が可能となった。同時期には発癌性キナーゼシグナリングの系統的レビュー (Blume-Jensen et al. Nature 2001) も発表され、キナーゼを創薬標的とする研究が加速していた。先行研究 (Hanks & Hunter 1991・Plowman et al. 1994等) では個々のキナーゼファミリーの解析に限定されていたが、本論文はヒトゲノム全体のキナーゼを系統的に分類し相互の進化的関係を初めて包括的に示した点で先行研究と根本的に異なる。

本研究で初めて示されたことは: (1) ヒトゲノム中に存在するキナーゼの総数が518個 (典型的478 + 非典型40) であること、(2) これらが進化的系統関係に基づく7大グループに分類できること、(3) 非典型的キナーゼ40個の7ファミリーへの初の体系的分類、の3点である。この518個という数値は当時の予測 (概算100〜2,000個) を初めて実証的に確定させた革新的な発見である。方法論的にはHMMプロファイル全ゲノムスキャン + 多段階系統樹構築という統合アプローチで、当時の先行研究が個別ファミリー解析に留まっていたのとは対照的に全体像を提供した。

臨床応用への影響は計り知れない。本キノームに収録されたTKグループのEGFR・ALK・ROS1・RET・MET・KIT・PDGFR・ABLはその後すべて承認済み分子標的薬の標的となった。PIKKグループのmTOR・ATM・ATRも重要な創薬標的として認識された。Brdファミリー (Brd2-4) はBET (Bromodomain and Extra-Terminal) 阻害剤開発の標的として後に注目され、多数の治験が開始された。未特徴化キナーゼ約100個の体系的な機能注釈プログラム (KinomeScan・LINCS等) もキノームを基盤として推進された。7大グループへの分類体系はCell Signaling Technology・PhosphoSitePlus等の主要データベースで継続使用されている。

残された課題として、本キノームは2002年時点のゲノムアノテーションに基づくものであり、スプライシングバリアント・疾患特異的変異体は含まれない。また酵素活性を持たない偽キナーゼ (pseudokinase) の全容解析も残された課題であった (後にHER3・STRADKALPHAなどの偽キナーゼの機能が明らかにされシグナル調節における役割が認識された)。今後の研究方向性として、各キナーゼの疾患特異的発現・変異パターンの体系的解析、および新たな創薬標的としての未特徴化キナーゼの機能解明が求められる。

方法

隠れマルコフモデル (HMM: Hidden Markov Model) プロファイル解析を用いてヒトゲノム全域からキナーゼ触媒ドメイン (kinase catalytic domain) を同定した。具体的にはhmmerパッケージのhmmsearchを用いてキナーゼ触媒ドメインのHMMプロファイルをヒトゲノムタンパク質セット全体に対してスキャンした。ClustalWタンパク質配列アラインメントに基づく近接結合法 (Neighbor-Joining method) で初期系統樹を構築し、hmmalignによる再アラインメントおよび最節約法 (maximum parsimony) による系統樹と徹底比較・修正を行って最終的な系統樹 (ヒトキノーム) を作成した。典型的キナーゼ (canonical kinase domain を持つもの) に加え、キナーゼ活性が検証されているが触媒ドメイン配列が大きく異なる非典型的キナーゼ (atypical kinase) も別途同定・分類した。未公開キナーゼはファミリー命名規則に従って命名し、系統的帰属が不明確なものはSgK (Sugen kinase) 番号で管理した。デュアルドメインキナーゼは「b」サフィックスで標識した (例: JAK1b)。配列同一性の統計的比較にはPearson r相関係数を用い、グループ内配列同一性分布の有意性をt検定で評価した。詳細な部分木・配列アラインメントはwww.kinase.comで公開された。