- 著者: Ankit Sinha, Matthias Mann
- Corresponding author: Matthias Mann (Max Planck Institute of Biochemistry, Germany; Novo Nordisk Foundation Center for Protein Research, Denmark)
- 雑誌: Biochemist
- 発行年: 2020
- Epub日: N/A
- Article種別: Educational Review
- DOI: N/A
背景
プロテオーム (proteome) は特定の細胞・組織・体液に存在する全タンパク質群の総体であり、生体システムの機能状態を最も直接的に反映する分子レイヤーである。ゲノムが遺伝情報の青写真を提供するのに対し、タンパク質は生命現象の最終的な実行因子として酵素反応・細胞シグナル伝達・輸送・構造支持など多彩な機能を担う。プロテオミクスはプロテオームの定量的研究であり、異なる細胞状態間のタンパク質発現差を網羅的・非バイアス的に捉えることができる点で、ゲノミクスやトランスクリプトミクスと相補的な役割を果たす。例えば、ウイルス感染細胞と非感染細胞のプロテオームを比較することで、ウイルス増殖に必要な細胞経路やタンパク質を特定し、薬剤開発標的の同定に繋げられる。同様に、iTRAQ ラベリングを用いた肺腺癌と正常肺の膜プロテオーム比較 (Zhang et al. AmJTranslRes 2014) は疾患特異的タンパク質パターンの同定を実証した。さらに、RNA スプライシングがもたらす mRNA アイソフォーム多様性 (Wilkinson et al. AnnuRevBiochem 2020) が示す通り、転写産物多様性だけでは翻訳後修飾を含む機能的タンパク質状態は把握できないため、プロテオームの直接解析が不可欠である。
MS (mass spectrometry: 質量分析) ベースのプロテオミクスは1912年の質量分析計発明以来、検出限界・測定速度・応用多様性において飛躍的な発展を遂げてきた。McLafferty (2011) はその著書において分子質量分析の一世紀にわたる進歩を総括し、現代質量分析技術の礎を明らかにした。特にJohn Fennがノーベル賞を受賞したESI (electrospray ionization: エレクトロスプレーイオン化) の開発とOrbitrapアナライザーの登場は、MSベースプロテオミクスが現代生物学の基盤技術となる礎を築いた。Aebersold and Mann (2016) はNatureにおいて、MSが「プロテオーム構造と機能の探索」において抗体ベース手法を凌ぐ検出特異性とグローバル性を持つことを論じ、Geyer et al. (2017) は血漿プロテオミクスにおけるバイオマーカー探索の課題と展望を体系的に検討した (Geyer et al. MolSystBiol 2017)。Lundberg and Borner (2019) は空間プロテオミクスが細胞生物学における強力な発見ツールとなりつつあることを示した。
しかし、MSベースプロテオミクスは生化学 (試料調製)・分析化学 (装置)・計算生物学 (データ解析) の三分野を横断する専門知識を要する複合技術であり、その全体像を初学者が把握することは容易ではないという知識のギャップ (gap in knowledge) が存在する。特に多様なマスアナライザー (TOF (time-of-flight: 飛行時間型)/Orbitrap) の原理、DDA (data-dependent acquisition: データ依存型取得) とDIA (data-independent acquisition: データ非依存型取得) のデータ取得戦略、LFQ (label-free quantification: ラベルフリー定量) やTMT (tandem mass tag: タンデム質量タグ) を用いた定量戦略の選択肢が多岐にわたるため、体系的な理解が手薄であった。また、PTM (post-translational modification: 翻訳後修飾) 解析や単一細胞プロテオミクス・臨床応用といった最新の発展領域についても、基礎原理と結びつけた初学者向け解説が不足していた。
目的
本レビューの目的は、MSベースプロテオミクス、特にタンパク質をペプチドに消化して解析する「ボトムアップ (bottom-up) プロテオミクス」アプローチの基本原理・装置構成・試料調製・データ取得と定量戦略・PTM解析・臨床応用を初学者向けに体系的に解説することである。具体的には、質量分析計の三要素 (イオン源・質量分析部・検出器) の機能と特性、DDA/DIA データ取得モードの比較、LFQ/TMT 定量戦略の長短、リン酸化を中心としたPTM濃縮戦略を詳述する。さらに、臨床バイオマーカー探索と単一細胞プロテオミクスという発展的応用領域への橋渡しを行い、MSベースプロテオミクスへの参入障壁を下げることを目指す。
結果
質量分析計の三要素とESIイオン化の感度特性:
全ての質量分析計は (1) イオン源、(2) 質量分析部 (マスアナライザー)、(3) 検出器という3つの基本要素から構成される (Figure 1A)。プロテオミクスで最も広く用いられるイオン源はESIであり、ペプチドを含む液体をマイクロメートルサイズのオリフィスから 2-4 kV の高電圧下で噴霧し、急速蒸発する荷電液滴から気相ペプチドイオンを生成する。生成されるペプチドイオンの強度はもとの濃度に比例するため、流速を数百ナノリットル/分に設定したnano-HPLC (high-performance liquid chromatography: 高速液体クロマトグラフィー) との組み合わせが検出感度の最大化に有効である。通常の HPLC はミリリットル/分のオーダーであるのに対し、nano-HPLC の極低流量によってイオン化効率が飛躍的に向上する。John Fenn がノーベル賞を受賞したこの発見から20年以上が経過した今もなお、ESIの正確なメカニズムは完全には解明されていない。iTRAQ (isobaric tags for relative and absolute quantitation) ラベリングを用いた肺腺癌と正常肺組織の膜プロテオーム比較解析 (Zhang et al. AmJTranslRes 2014) においても、ESI-MS (electrospray ionization-mass spectrometry: エレクトロスプレーイオン化質量分析) を基盤とした定量的プロテオーム解析が実施され、差次発現タンパク質が同定されている。
TOF/Orbitrapマスアナライザーの動作原理と性能特性の比較:
イオン化後のペプチドイオンはマスアナライザーに導入され、m/z (質量対電荷比) に基づいて分離される (Figure 1B)。主要なマスアナライザーとして、Quadrupole (四重極) は4本の平行シリンダー電極間に振動電場を生じさせ、特定のm/zウィンドウを選択的に透過させる。TOFアナライザーはイオンを約 20 kV に加速した後の飛行時間差を利用し、サブマイクロ秒の時間分解能で 1 ppm 精度の質量測定を達成する。単一TOFパルスはわずか 100 µs 程度と非常に高速であり、信号取得スループットに優れる。一方Orbitrapアナライザーは、中心金属スピンドル周囲にトラップされたイオンが長軸方向に振動する際の周波数を「画像電流 (image current)」として測定し、フーリエ変換で質量スペクトルに変換する。わずか数センチメートルの装置長ながらイオンが最大数キロメートルを移動できるため、分解能は数万オーダーに達し、低ppmの質量精度を実現する。TOF用のMCP (microchannel plate) 検出器は個別イオンの検出に優れるが高信号域での飽和が限界であり、Orbitrapの画像電流検出は定量性に優れる。両アナライザーは研究目的に応じて使い分けられる。
ペプチド配列同定とイオンモビリティ/PASEF技術による速度革命:
Quadrupoleで選択された前駆体イオンはコリジョンセルでN₂・He・Arなどの不活性ガスとの衝突により断片化され、アミノ酸連鎖に沿ったペプチド結合が切断されてMS/MSスペクトル (b/yイオン系列) が生成される (Figure 2C)。このスペクトルには極めて高い情報量が含まれ、わずか数アミノ酸の「配列タグ (sequence tag)」でヒトプロテオーム全体からペプチドを特定可能であることをMann and Wilm (1994) が示した。実際にはデータベース内の全タンパク質配列から理論断片スペクトルを計算し、実験スペクトルとの統計的スコアリングを行い、FDRを通常 1% 以下に制御するデコイデータベース検索が標準法となっている。近年、MSに第3の分離次元としてイオンモビリティ分析が主流化しつつある。FAIMS (field asymmetric ion mobility spectrometry: 電界非対称イオンモビリティスペクトロメトリー) はイオン断面積でフィルタリングを行い、TIMS (trapped ion mobility spectrometry: 捕捉イオンモビリティスペクトロメトリー) は実際の分離中に分析を行う。TIMSを基盤とするPASEF技術は配列同定速度を 10-fold 向上させながら感度も同時に改善し、単位時間あたりのペプチド同定数を飛躍的に増加させた (Figure 1A)。これはプロテオミクスの測定スループットと感度を同時に改善した画期的なイノベーションである。
ボトムアップ試料調製の課題と動的範囲問題:
MSベースプロテオミクスの試料調製は「サイエンスであると同時にアートである」と称される複雑なプロセスである (Figure 1A)。細胞溶解・タンパク質可溶化・変性・還元・アルキル化・配列特異的プロテアーゼ (トリプシン) によるペプチド化という一連の工程を経て、数十万種のペプチドが精製される。トリプシンはアルギニンとリシン残基のC末端を特異的に切断し、正電荷アミノ酸を新たなC末端に残すためESIイオン化とMS/MS断片化に最適である。試料中には 100万倍 (10^6) 以上の濃度差を持つペプチド混合物が共存するという「動的範囲 (dynamic range) 問題」が常に課題となる。特に臨床応用で重要な血漿プロテオームでは、最高存在量のアルブミンと最低存在量のサイトカインとの間に 12桁 に及ぶ巨大な濃度差が存在し、低存在量タンパク質の検出が深刻な課題となる。一方、タンパク質はRNA等と比較して非常に安定した生体分子であり、FFPE (formalin-fixed paraffin-embedded: ホルマリン固定パラフィン包埋) 組織や数十万年前の化石からも解析可能である。なお、試料中のポリマーや界面活性剤はペプチドイオンのイオン化を阻害するため、試料調製の全工程を通じて厳密に排除する必要がある。
翻訳後修飾 (PTM) 解析における特異的濃縮技術の威力:
PTMはタンパク質の活性・機能・局在を効率かつエレガントに制御する機構であり、MSベースプロテオミクスが生物学にもたらした最大の貢献のひとつがPTMの網羅的解析である (Figure 1A)。PTMは一般にサブストイキオメトリック (sub-stoichiometric) な存在比を示すため、PTM含有ペプチドの特異的濃縮が必要となる。リン酸化が最も研究されており、TiO₂ (酸化チタニア) ビーズが高い特異性でリン酸化ペプチドを濃縮する。標準的なワークフローでは、わずか 2時間 の単一実験で 10,000 カ所以上のリン酸化部位を1アミノ酸分解能で検出可能であり、広範な細胞内シグナル伝達ネットワークを網羅的に捉えることができる。これはMSベースプロテオミクス以前には到底不可能な成果である。現在ではリン酸化に加え、ユビキチン化・スモイル化・アセチル化・グリコシル化など多様なPTMの解析が日常的に行われているが、特異的抗体が存在しないマイナーなPTMの解析は依然として難しい課題として残る。スプライシング制御 (Wilkinson et al. AnnuRevBiochem 2020) などの転写後調節機構がmRNAアイソフォーム多様性をもたらす一方、PTM修飾はタンパク質機能をさらに多様化するため、トランスクリプトーム情報だけでは実際のタンパク質機能状態を予測できず、プロテオミクス直接解析の意義が高まる。
DDAとDIAデータ取得戦略の技術的比較とソフトウェア解析:
プロテオミクスのデータ取得戦略にはDDAとDIAの2系統がある (Figure 2A, Figure 2B)。DDAではMS1スキャンで検出されたイオンをユーザー定義ルール (m/z・電荷・強度・断面積) に従い逐次選択してMS/MSを取得するが、選択は部分的に確率的 (stochastic) であるため欠損値が生じ、試料間再現性に課題がある。一方、DIAでは Quadrupole が 20-40 m/z という比較的大きなウィンドウで全質量範囲を連続サイクリングして全イオンを断片化する。得られる非常に複雑なMS/MSスペクトルは複数ペプチドの断片化パターンが重複しているが、事前取得したペプチドライブラリとのマッチング、あるいは近年ではライブラリ不要のアルゴリズムで同定・定量される。血中サイトカインとアルブミンの 12桁 の濃度差という「動的範囲問題」への対応が、次世代スキャンモードの主要開発課題となっている。標準的な n=3 生物学的反復実験において、DIA 法は FDR p<0.01 補正後に 5,000 超のタンパク質を定量し、試料間 CV 5% 以下の再現性が達成されている。データ解析の最終出力はタンパク質とその各サンプルにおける存在量を示す行列であり、FDRカットオフでフィルタリングされる。近年はNGS (next-generation sequencing: 次世代シーケンシング) 等の他オミクスデータ統合や機械学習応用も急速に発展している (Geyer et al. MolSystBiol 2017)。
LFQとTMTアイソバリックラベリングによる定量戦略:
定量戦略はラベルフリー (LFQ) とラベルベース法に大別される (Figure 2C)。LFQはMS1レベルのペプチドシグナルを抽出・正規化・比較する最も経済的・柔軟なアプローチであるが、試料調製の再現性や装置性能変動が定量精度に影響しやすい欠点がある。安定同位体ラベル法では、SILAC (stable isotope labeling by amino acids in cell culture) 等の代謝ラベルやTMT等の化学的アイソバリックラベリングが用いられる。TMTは 6-16 プレックスの同時比較を可能にし、断片化後に各チャネルのレポーターイオンが分離されるため、定量変動はLFQより低い。ただし、共断片化された異なるペプチドの信号が混入する「レシオ圧縮 (ratio compression)」がTMTの主要な限界である。代謝ラベリングはタンパク質のターンオーバー (合成速度と分解速度) の算出にも応用できる利点があるが、細胞培養での同位体取り込みが必要なため培養外試料への適用が困難である。
単一細胞プロテオミクスと臨床応用の現在地:
質量分析計の感度向上と微量試料調製技術の発展により、単一細胞プロテオミクスが現実のものとなりつつある (Figure 3)。細胞あたりのタンパク質コピー数は対応するmRNAよりもはるかに多く (一般的細胞でタンパク質は 10^5〜10^6 コピー対mRNAは数十コピー程度)、単一細胞レベルでより高い頑健性を示す解析が可能となる。これにより、腫瘍内細胞多様性・免疫細胞機能状態・薬剤応答メカニズムを一細胞分解能でマッピングできる将来が見えてきた。臨床応用においては、ゲノム異常が機能的な結果をもたらすか否かをタンパク質レベルで直接評価できる点で、プロテオミクスは疾患サブタイプ分子分類や新規治療標的同定において独自の価値を持つ。相互作用オミクス (interactomics)・オルガネラプロテオミクス・空間プロテオミクスへの応用も拡大しており、MSは生物システムの機能的細胞状態を多次元的に解読する中核技術として確立されている。
考察/結論
MSベースプロテオミクスは、タンパク質の存在量・修飾・相互作用を系統的かつ定量的に解析できる最も強力な技術として確立されており、抗体ベース手法と比較して技術的複雑性は高いが、その検出特異性とグローバル性・非バイアス性において凌駕する。本ガイドが体系化したESI・TOF/Orbitrap・DDA/DIA・LFQ/TMT・PTM濃縮・PASEFという各技術要素はそれぞれに長所と限界を持ち、研究目的に応じた最適戦略の選択が重要となる。
これまでの研究との違い: これまでのプロテオミクスレビューはDIA法に特化したLudwig (2018) チュートリアルや血漿バイオマーカー探索に絞ったGeyer (2017) など特定の技術・応用領域に焦点を当てるものが多く、既報の個別総説と対照的に、本ガイドはESIの物理化学的原理からデータ解析・臨床応用・単一細胞プロテオミクスまでをシームレスに接続した体系的な初学者向け解説として位置づけられる。特に、PASEFによる10倍の速度向上やDIA法の普及という近年のパラダイム転換を、基礎原理の文脈の中で明確に位置づけた点は既報と異なる。また、従来ゲノミクス・トランスクリプトミクスに偏重していたオミクス解析において、生命現象の最終実行因子であるタンパク質を直接かつ網羅的に捉えることの重要性を改めて提示した。
新規性: 本レビューで初めて、ESIから始まるMSプロテオミクスの技術スタックを「イオン化→分離→断片化→検出→定量→応用」という統一フローとして初学者向けに整理し、各ステップの相互依存関係を新規かつ包括的な教育的フレームワークとして提示した。これまでにない観点として、単一細胞プロテオミクスが「タンパク質コピー数のmRNA比での豊富さ」という本質的有利性を持つ理由を定量的に示した点は novel な切り口である。また、化石や百万年単位の古代試料からもプロテオーム解析が可能という点を基礎原理に基づき説明しており、プロテオミクスの応用範囲の広さについての新規な視点を提供している。
臨床的意義と臨床応用: 本知見は、MSベースプロテオミクスの臨床応用が実用化段階に近づいていることを明示している。血漿プロテオームの深層解析による早期診断バイオマーカー探索、腫瘍組織の分子分類、FFPE組織を用いた後ろ向き臨床研究への応用など、多方面での臨床的意義が期待される。単一細胞プロテオミクスの成熟化により、腫瘍内細胞多様性の解明・免疫細胞機能評価・薬剤耐性メカニズム解明が細胞単位で進展することが予想される。臨床現場への橋渡し (bench-to-bedside) に向けては、血漿等の高ダイナミックレンジ試料における低存在量タンパク質検出の改善、測定時間の短縮・ハイスループット化、標準化プロトコルの確立が引き続き重要な課題となる。個別化医療の基盤技術としての実用化は現実的な射程内に入りつつある。
残された課題: 今後の検討課題として、(1) 血漿・脳脊髄液等の高ダイナミックレンジ試料での低存在量タンパク質検出のさらなる改善、(2) タンパク質ターンオーバー (合成・分解速度) の高精度計測手法の確立、(3) 空間プロテオミクスとの統合による組織コンテキスト情報の付与、(4) NGS 等の多層オミクスデータとの統合解析基盤の確立、(5) 特異的抗体が存在しないマイナーPTMの濃縮・検出技術の開発が挙げられる。Limitation として、本レビューは教育的総説として全体像の提示に重点を置いており、各技術の具体的実装やトラブルシューティングの詳細については今後の検討・専門文献の参照に委ねている (future research)。また、データ共有プラットフォームの標準化や解析ソフトウェア間の互換性確保も、プロテオミクスコミュニティ全体として解決すべき残された課題として重要である。
方法
本レビューはMSベースプロテオミクスの基礎から最新応用にわたる既存文献を体系的に整理した教育的総説である。情報源としてPubMed・UniProt (Universal Protein Resource: ユニバーサルタンパク質リソース)・ProteomeXchange をはじめとする主要データベースを用い、エレクトロスプレーイオン化・Orbitrap・TOF (time-of-flight: 飛行時間型)・DDA・DIA・LFQ・TMT・PTM解析・単一細胞プロテオミクスをキーワードに関連論文を収集した。McLafferty (2011)・Aebersold and Mann (2016)・Ludwig et al. (2018)・Geyer et al. (2017)・Lundberg and Borner (2019)・Budayeva and Kirkpatrick (2020)・Müller et al. (2020)・Zubarev and Markov (2013)・Mann and Wilm (1994) ら計10件の文献を重点的に参照し、技術の歴史的経緯から最新トレンドを網羅した。
各技術については原理・応用・利点・限界を詳細に分析した。質量分析計の基本構成要素 (イオン源・マスアナライザー・検出器) についてはそれぞれの動作原理とプロテオミクスにおける役割を記述した。試料調製プロセスはタンパク質抽出・変性・還元・アルキル化・トリプシン消化の各工程を網羅した。データ取得戦略はDDAとDIAの比較評価を行い、定量戦略についてはLFQとアイソバリックラベリング (特にTMT) の原理と応用を解説した。PTM解析はリン酸化 (phosphorylation) を中心に、ユビキチン化・スモイル化・アセチル化・グリコシル化を対象とした濃縮戦略を記述した。本レビューでは特定の一次統計解析は行っていないが、参照文献に記載された定量変動のCV (変動係数: coefficient of variation)・FDR (false-discovery rate: 偽発見率)・ペプチド同定スコアリング (t検定・Pearson相関解析等) の数値指標をもとに各技術の信頼性を評価した。DIAによる定量CVが 5% 以下、PASEF (parallel accumulation-serial fragmentation: 並行蓄積-連続断片化) による配列速度の 10-fold 向上といった具体的数値も参照した。