Article data
Spatial distribution of the proteome in the human body and in cancers
- 著者: Liang Yue, Wenhao Jiang, Sainan Li, Meng Luo ほか ( 共同筆頭 4 名 ) , Yi Zhu, Yong Ji, Yan Li, Tiannan Guo ( 共同責任著者 )
- Corresponding author: Yi Zhu / Yong Ji / Yan Li / Tiannan Guo ( Westlake University ほか )
- 雑誌: Nature
- 発行年: 2026
- Epub日: N/A
- Article種別: Original Article ( large-scale resource / atlas )
- PMID: 42310461
背景
ヒトの組織・臓器は共通のゲノム設計図から発生過程で多様化し、腫瘍などの病態でその機能が破綻する。組織横断的なタンパク質発現の変動を発生と病理の両文脈で記述することは、ヒト生物学の理解と治療開発の前提となる。しかし既存の組織レポジトリは網羅性に乏しかった。トランスクリプトーム資源 ( ArrayExpress, RNA-Seq Atlas, BioGPS, そして疾患非罹患組織を拡充した Adult GTEx プロジェクト ) は組織発現の初期注釈を与えたが、mRNA 量は主要な機能分子かつ創薬標的であるタンパク質の発現とは中等度の相関しか示さない。Human Protein Atlas ( HPA ) は 2005 年に免疫組織化学を起点に開始され、2015 年までに 32 健常組織のトランスクリプトームと 20,456 抗体に基づく 44 健常組織のプロテオームを統合したが、抗体依存の半定量性ゆえ有効抗体を欠く数千タンパク質の信頼性ある定量には限界があった。質量分析 ( MS ) はこの制約を回避する網羅的・多重・非バイアスな定量手段であり、2014 年の 2 つの MS ドラフトは約 30 組織・細胞株でヒト遺伝子産物の約 85% を同定し ( Burley et al. NEnglJMed 2021 が示す構造予測時代の基盤となる配列同定の系譜 ) 、その後 Wang ら ( 2019 ) は 29 組織で 15,210 protein group を、近年は 12,027 タンパク質を 32 組織で同定した。だがこれらは約 30 主要組織に限定され多くの組織が未踏のまま残り、健常組織とがん組織の包括的比較も欠いていた。一方で TCGA ( The Cancer Genome Atlas ) や CPTAC ( Clinical Proteomic Tumor Analysis Consortium ) などのコンソーシアム ( Cerami et al. CancerDiscov 2012 が整備した cBioPortal を含む多階層がんゲノム資源 ) は特定腫瘍について広範な多階層データを生成したが、プラットフォーム・コホートの不均一さからがん種間の横断比較は困難であり、がん間の差異に関する洞察を制約していた。タンパク質レベルでの腫瘍特異変動を定量する取り組みは細胞株 ( Zhao et al. CancerCell 2020 ) や扁平上皮 ( Song et al. NatCommun 2022 ) で進んだが、健常組織を含む全身横断の参照基盤を欠いていた。何が足りなかったか / 未解明だった点: 広い組織カバレッジと高深度・高スループットのプロテオミクスを単一の統一パイプライン・プラットフォームで同時に達成し、胎児・腫瘍・隣接非腫瘍・健常成人を横断比較できる空間分解ヒトプロテオーム資源は依然として存在せず、臓器特異的毒性や汎がん標的の体系的解釈は 未解明 のままであった。本研究はデータ非依存型取得質量分析 ( DIA-MS ) を用いてこの空隙を埋め、固形組織・体液・主要がん種をほぼ網羅する 13,609 タンパク質の空間分布を提示する。
目的
DIA-MS により胎児 ( fetal, F ) ・腫瘍 ( tumour, T ) ・対の隣接非腫瘍 ( non-tumour, NT ) ・健常成人 ( normal, N ) という四つの病態生理状態を横断する、解剖学的に分解されたヒトプロテオームアトラスを構築すること。具体的には ( 1 ) 組織型・状態間のプロテオーム軌跡を空間分解で描出し発生過程とがん進展への洞察を得る、 ( 2 ) 組織特異タンパク質を同定し臓器特異的毒性の分子的基盤となる薬剤標的の組織分布を地図化する、 ( 3 ) 対腫瘍・非腫瘍比較から汎がん性のタンパク質変動を抽出する、 ( 4 ) リポジショニング可能な抗がん薬候補とがん治療標的を優先順位づけする、ことを目的とした。最終的には「ヒトの身体のデジタルナビゲーター」の創出に向けた定量的資源を確立することを意図する。
結果
検体規模と DIA-MS プロテオーム測定:本資源は post-mortem の成人ドナー 9 名、健常被験者 8 名、post-mortem 胎児ドナー 9 名、がん患者 1,015 名から得た計 2,856 検体に基づく。まず 15,332 protein group を含む包括的ヒトスペクトルライブラリを構築し、非ヒト種の entrapment スペクトルを統合した複合ライブラリに対し DIA-MS 生データを検索することで品質を担保した。結果として 3,005 の MS ファイル横断で 13,609 タンパク質が protein-level の global FDR 0.1% で定量された ( Fig. 1 ) 。データは 58 主要組織型・251 特異的組織サブタイプ・25 がん種にまたがり、複製間の高い再現性と最小のバッチ効果を示し全体として高いデータ品質が確認された。検体型・組織型間ではプロテオームが顕著な異質性を示した ( Fig. 2 ) 。
発生・がん化を貫く F-T-NT-N 軌跡:全検体の t-SNE ( t-distributed stochastic neighbour embedding ) 解析では、胎児 ( F ) ・腫瘍 ( T ) ・対非腫瘍 ( NT ) ・健常成人 ( N ) という四状態 ( F-T-NT-N と略記 ) が t-SNE 1 軸に沿って F-T-NT-N の順に秩序立って配置され、これは組織分化度を反映する ( Fig. 2a ) 。注目すべきは脳腫瘍・肝腫瘍とそれぞれの対非腫瘍組織がこの F-T-NT-N パターンから逸脱し、検体型ごとではなく組織型ごとに集簇した点である ( Fig. 2b ) 。各検体に擬時間 ( pseudotime ) 値を付与する軌跡解析により、脳組織は悪性転換と発生を通じて例外的なプロテオーム安定性を示し ( 低 pseudotime かつ四状態を通じて分散が最小 ) 、対照的に肝の腫瘍・非腫瘍は胎児肝から遠い高 pseudotime に集簇した。教師なしクラスタリングで一貫した発現を示す 8 つのタンパク質モジュールを同定し、module 3 は F-T-NT-N で下降し RNA スプライシングに高度に濃縮 ( Wilkinson et al. AnnuRevBiochem 2020 のスプライソソーム機構が発生とがん化双方で果たす役割と整合 ) 、module 8 は F-T-NT-N で漸増し液性免疫応答に有意に濃縮された ( Fig. 2c ) 。
組織特異タンパク質発現と組織分類:組織内・組織間の Euclidean 距離と相関係数を比較した結果、眼や軟骨など群内異質性の高い組織をサブタイプに分割して 74 の精緻化組織型を得た。すべての精緻化組織型は群内で群間より有意に小さい距離・高い相関を示した。タンパク質を HPA 基準に従い 6 群 ( 未検出・組織濃縮・群濃縮・全組織発現・組織増強・混合 ) に分類したところ、脳が最も多くの組織濃縮タンパク質を含み、水晶体は組織濃縮タンパク質の総存在量比が全同定タンパク質に対し最大であった ( Fig. 3a ) 。同定した 1,717 個の組織濃縮タンパク質のうち 749 個が既報のヒトプロテオーム/トランスクリプトームで対応組織に濃縮と報告済みで、666 個がタンパク質レベルで、426 個が HPA RNA-seq データで一致濃縮を示した。HPA と重複する 36 組織横断で本データセット固有の濃縮タンパク質を 832 個、HPA RNA データ固有を 122 個同定し、さらに従来研究で過小評価されていた 24 組織型で 480 個の組織濃縮タンパク質を同定した。HPA で「未検出」とされる PANX3 を蝸牛 ( cochlea ) 最高濃縮タンパク質として同定し、2 ペプチド ( LVQHMLK, YFEFPLLER ) で蝸牛特異発現を確認した。
薬剤標的の組織分布と臓器特異的毒性:組織特異的な薬剤標的発現が標的外毒性に寄与しうるため、組織濃縮タンパク質を DrugBank 標的に対応づけ、34 組織型にわたり 2,598 薬剤に対応する 402 タンパク質を同定した ( Fig. 3b ) 。肝が最多の組織濃縮薬剤標的を含み、これは薬剤性肝障害の高頻度を一部説明する。肝に高度濃縮された Cytochrome P450 2C8 ( CYP2C8 ) は 302 薬剤の標的であり、その不可逆阻害薬 gemfibrozil の併用は CYP2C8 代謝薬の血漿濃度を 8 ~ 10 倍に上昇させ、スタチン併用での横紋筋融解・急性腎障害や抗糖尿病薬併用での重症低血糖を引き起こす。さらに局所適用の抗菌薬 triclosan は甲状腺に濃縮される thyroid peroxidase を標的とし、甲状腺自己免疫と恒常性への影響や母体 free thyroxine・新生児 triiodothyronine 低下との逆相関が 2 つの疫学研究で示された ( Fig. 3b ) 。
汎がんタンパク質変動と腫瘍特異 DEP:対腫瘍・非腫瘍プロファイルを線形混合モデルで比較し、25 腫瘍型横断で 8,940 個の差次発現タンパク質 ( DEP ) を同定した ( Fig. 4 ) 。結腸癌・直腸癌・精巣癌が最多の DEP を持ち、glioblastoma が最少で、これは T と NT 脳検体が t-SNE 上で近接する所見と整合する。20 を超えるがん種で上昇する DEP は 33 個あり、MCM4 や NUDT1 ( MTH1 ) など既報の発がんドライバーを含む。DEP のうち 2,878 個は単一腫瘍型のみで有意に変動する腫瘍特異 DEP で、HCC ( hepatocellular carcinoma, 肝細胞癌 ) が最多、次いで diffuse large B-cell lymphoma ( DLBCL ) と GIST ( gastrointestinal stromal tumour, 消化管間質腫瘍 ) が続いた ( Enssle et al. CancerCell 2026 が示す DLBCL の proteogenotype 異質性と接続する所見 ) 。GIST 特異上昇 DEP ではシナプスシグナル伝達 ( GO:0099536, q = 1.10 × 10⁻⁴ ) が濃縮され、Cajal 介在細胞 ( ICC ) 由来という起源と一致し、KIT・ANO1 が GIST 特異上昇 DEP として同定された ( Fig. 4 ) 。131 個の腫瘍特異 DEP は対応正常組織で組織濃縮を示す LEDEP ( locally enriched DEP, 局所濃縮差次発現タンパク質 ) であり、胃癌での LIPF/GKN1、膵癌での外分泌マーカー ( CELA2A, CPA1, PNLIP ) のような組織特異機能喪失を反映した。TCGA トランスクリプトーム・CPTAC プロテオームと交差検証し、本データ・CPTAC・TCGA で一致する 4,263 上昇・1,716 下降 DEP を同定、Human Pathology Atlas との統合で 16 がん種横断 7,336 個の予後関連タンパク質を抽出した。
薬剤リポジショニングと治療標的優先順位づけ:腫瘍間で共有される上昇 DEP のうち 77 個が 36 の生体分子薬 ( 主に受容体型チロシンキナーゼ ( RTK ) 阻害薬 ) の標的で、2,084 の臨床試験で評価されていた ( Fig. 5 ) 。ENCA ( endometrial carcinoma, 子宮内膜癌 ) は BRCA ( breast carcinoma, 乳癌 ) に比べ承認/開発中薬が著しく少なく未充足ニーズが浮き彫りになった。抗 TROP2 抗体と TOP1 阻害薬 SN-38 を結合した antibody-drug conjugate である Trodelvy ( sacituzumab govitecan ) は TROP2・TOP1 が ENCA と BRCA の両方で共上昇しており ENCA への有効性が示唆され、第 II 相 ( NCT04251416 ) で支持され第 III 相 ( NCT06486441 ) で評価中である。さらに ProCan-DepMapSanger データ ( Zhao et al. CancerCell 2020 が確立した細胞株プロテオーム-薬剤感受性連関 ) と統合し、9 個の DEP を標的とする 35 薬剤を優先化、MET・BCL2L1 高発現が savolitinib・tepotinib・merestinib ( MET 阻害薬 ) と navitoclax の効力増大 ( β < −0.1, FDR < 0.01 ) と相関した。最終的に血漿膜局在の腫瘍濃縮タンパク質 41 個を低毒性候補として優先化し、10 腫瘍型で濃縮の TYROBP、GIST 特異の KIT、DLBCL の PAX5 を治療標的候補として提示した。
考察/結論
先行研究は約 30 組織に限定された MS ドラフトや HPA の半定量的抗体データに依拠しており、本研究はそれら既報と異なり 58 健常組織・25 がん種・22 胎児組織を単一の DIA-MS プラットフォームで網羅し、胎児・腫瘍・隣接非腫瘍・健常成人の四状態を一つの解析基盤で横断比較できる点で従来資源と対照的である。TCGA や CPTAC がプラットフォーム・コホートの相違ゆえがん種間横断比較を困難にしてきたのに対し、本研究は統一パイプラインでこの相違を克服した。新規な知見として、本研究で初めて F-T-NT-N の擬時間軌跡を全身規模で定量化し、脳のプロテオーム安定性と肝の高い可塑性という臓器固有の挙動を提示した。また HPA で「未検出」だった PANX3 を蝸牛特異タンパク質としてペプチド合成で確認するなど、これまで報告されていない 480 個の組織濃縮タンパク質を 24 の過小評価組織から同定した点も独自性が高い。臨床応用の観点では、組織濃縮薬剤標的の空間分布が CYP2C8-gemfibrozil 相互作用や triclosan-甲状腺毒性のような臓器特異的有害事象の分子的病因を解釈する分子参照を与え、標的外毒性が最小と期待される 41 個の膜局在腫瘍濃縮タンパク質や Trodelvy・olaparib の ENCA への適応拡大という具体的な橋渡し仮説を提供し、創薬標的探索への直接的な臨床的意義を持つ。残された課題として著者らは複数の限界 ( limitation ) を挙げる。第一に正常検体が主に高齢ドナー由来であり乳腺の involution など一部組織の提示に影響しうる。第二に毛髪や体液など特殊組織には専用プロトコルを用いたため組織横断比較にアーティファクトを導入しうる ( 著者らはこれら組織からの優先順位づけを回避した ) 。第三に包括的組織カバレッジを優先した結果、腫瘍型あたりの患者数が約 40 名に制約され ( TCGA の約 200、CPTAC の約 160 と比べ少ない ) 、患者間異質性の特徴づけが限られる。今後の検討として、より大規模なコホートでの患者間異質性の解像、提示された治療標的・リポジショニング候補の前臨床・臨床検証が課題として残る。
方法
検体は Dalian Medical University と Shanghai Jiao Tong University の body donation centre から post-mortem interval 10 時間以内で剖検検体を、対腫瘍・非腫瘍検体を Harbin Medical University Cancer Hospital ( 2019 年 12 月 ~ 2022 年 12 月 ) と Huashan Hospital から、胎児剖検検体を Shenzhen Baoan District Maternal and Child Health Hospital から収集した ( 各施設 IRB 承認・書面同意取得 ) 。解剖学的正確性は 2 名の解剖学者による標準化マクロ解剖と 2 名の病理医による H&E 染色 FFPE ( formalin-fixed paraffin-embedded, ホルマリン固定パラフィン包埋 ) 切片の独立検証で担保した。検体は FFPE 形式で保存し、heptane 脱パラフィン後、pressure cycling technology ( PCT ) microtube 内で Tris-HCl ( pH 10, 95 °C, 30 分 ) によるアルカリ加水分解、6 M urea・2 M thiourea 溶解バッファ、TCEP・iodoacetamide による還元アルキル化を行い、Barocycler NEP2320 で PCT 補助溶解 ( 90 サイクル ) を実施。LysC ( 1:80 ) ・trypsin ( 1:20 ) で消化し C18 spin column で脱塩、UltiMate 3000 RSLCnano で 60 分勾配により 60 分画を 10 分画に統合した。骨・歯は専用に粉砕・10% FA 一晩消化のプロトコルを適用した。統計解析では検体型横断の差次発現を one-way ANOVA ( B-H 調整 P < 0.05 ) で評価し 8 共発現モジュールにクラスタリング、対腫瘍・非腫瘍比較は線形混合モデル ( linear mixed-effects model ) で実施、効果量は Hedges’ g で標準化し、薬剤・CRISPR 連関は通常最小二乗回帰係数 β で評価した。検証には PRM ( parallel reaction monitoring, 平行反応モニタリング ) と targeted MS、two-tailed paired t-test を用いた。資源 DOI は 10.1038/s41586-026-10660-y であり、code・source data は Online content に記載される。