• 著者: David Scieszka, Yi-Han Lin, Weizhong Li, Saibyasachi Choudhury, Yanbao Yu, Marcelo Freire
  • Corresponding author: Marcelo Freire (J. Craig Venter Institute, La Jolla, CA, USA + Division of Infectious Diseases and Global Public Health, University of California San Diego)
  • 雑誌: Scientific Data (Nature Publishing Group)
  • 発行年: 2022
  • Epub日: 2022-11-30
  • Article種別: Data Descriptor
  • PMID: 36385149

背景

好中球は、炎症反応や感染防御において重要な役割を担う最も豊富な白血球である。2004年にBrinkmann et al. Science 2004によって初めて報告されたNeutrophil Extracellular Traps (NETs)​は、好中球がクロマチンDNA、ヒストン、および抗菌タンパク質(ミエロペルオキシダーゼ (MPO)、エラスターゼ、カルプロテクチンなど)を細胞外に放出し、細菌、ウイルス、真菌などの病原体を捕捉・排除するメカニズムとして認識されている。しかし、NETsの過剰な形成は、全身性エリテマトーデス (SLE)、慢性閉塞性肺疾患 (COPD)、糖尿病、アテローム性動脈硬化症、腫瘍転移、COVID-19による急性呼吸窮迫症候群 (ARDS) など、多様な病態に関与することがPapayannopoulos et al. NatRevImmunol 2018Krishnamoorthy et al. SciImmunol 2018によって報告されており、その病態生理学的意義が注目されている。

NETsの分子組成に関する研究は、Urbanら (2009 PLoS Pathog) による24種類のタンパク質、O’Donoghueら (2013 Proteomics) による34種類のタンパク質、Chapmanら (2012 Proteomics) による27種類のタンパク質を同定した小規模なプロテオミクス研究や、個別の遺伝子発現解析が多数存在する。しかし、これらのデータセットは分散しており、異なる刺激条件や細胞源の不均一性により、NETsのゲノムおよびプロテオームを統合的に解析した包括的なデータベース、すなわち「NETome」がこれまで不足していた。NETsの正確な分子シーケンスを解読する必要性が強調されており、既存のモデルでは寿命が短い、取り扱いに敏感であるといった好中球本来の特性に起因する限界が存在した。特に、NETsの形成メカニズムや病態生理におけるゲノムレベルでの詳細な理解は未解明であり、その分子的な構成要素を網羅的に解析したデータベースの構築は喫緊の課題であった。既存のデータは断片的であり、NETsの全容を捉えるには情報が不十分であったため、包括的なアプローチが強く求められていた。

J. Craig Venter InstituteのFreireグループ(感染症およびゲノミクス分野の権威)は、これらの課題を克服するため、HL-60細胞株を分化させたin vitroヒト好中球モデルと、次世代シーケンサー (Illumina NovaSeq 6000) によるRNA-seq、および液体クロマトグラフィー・タンデム質量分析 (LC-MS/MS) によるプロテオミクスを組み合わせたアプローチを採用した。これにより、NETsの包括的な分子プロファイリングを実施し、初の統合的なNETomeリソースを構築した。本研究は、この統合データベースをScientific Data誌にデータ記述子として公開し、コミュニティでの再利用を可能にすることを目的としている。

目的

J. Craig Venter InstituteのFreireグループは、以下の目的を掲げた。(1) ヒトNETsのゲノムおよびプロテオームを統合的に解析したマルチオミクスデータベース「NETome」を構築すること。(2) HL-60骨髄系細胞株を好中球様細胞 (dHL60) へ分化させ、PMA (Phorbol 12-myristate 13-acetate) 刺激によりecTrap (extracellular Trap) を産生する標準化されたin vitroプロトコルを確立すること。(3) Illumina NovaSeq 6000を用いたRNA-seq (47xカバレッジ) およびLC-MS/MSプロテオミクス (Benzonase処理および非処理条件) により、ecTrapの包括的な分子プロファイリングを実施すること。(4) 取得したゲノムおよびプロテオームデータをNCBI SRA (Sequence Read Archive)、PRIDE (Proteomics Identifications Database)、Figshareなどの公開データベースに預託し、研究コミュニティによる再利用を可能にすること。(5) NETs関連遺伝子およびタンパク質の機能解析、ならびにテロメアDNAやミトコンドリアDNAなどの特定のゲノム領域における濃縮解析を行うこと。これらの目的は、NETs関連疾患のバイオマーマーや治療標的の探索に貢献する新たなリソースを提供することを目指している。

結果

プロテオーム解析: 2,364個のタンパク質同定とNET関連タンパク質の濃縮: LC-MS/MSプロテオミクス解析において、Benzonase処理を行ったecTrapサンプルからは、合計2,364個のタンパク質が同定された (n=3 replicates)。これは、従来のUrbanら (2009) やO’Donoghueら (2013) の研究で報告された20〜30個のタンパク質と比較して、一桁多い包括的なプロファイルである。Benzonase非処理条件では1,711個のタンパク質が同定されており、Benzonase処理がDNA/ヒストン結合タンパク質の放出と検出効率の向上に寄与したことが示唆された (Fig. 2a)。HL-60およびdHL60細胞と比較してecTrapでは、126個のタンパク質が2倍以上の有意な変動を示した (Permutation FDR <0.05)。古典的なNETs関連酵素であるミエロペルオキシダーゼ (MPO)、カルプロテクチン (S100A8/A9)、Cathepsin G、エラスターゼ、およびヒストンH2A/H2B/H3/H4が高発現しており、これまでの知見と一致し、さらに拡張された。新規にecTrapで濃縮されたタンパク質として、ミトコンドリアタンパク質 (ATPシンターゼ、シトクロムc)、リボソームタンパク質、RNA結合タンパク質、テロメラーゼ関連タンパク質などが同定され、予想外の発現プロファイルを示した。GO解析では、好中球脱顆粒の正の制御、RNA結合、ミトコンドリアタンパク質、テロメラーゼ活性化経路が有意に濃縮されていることが示された (Fig. 2d)。特に、ヒストンタンパク質はBenzonase処理群で2-fold以上の増加を示し、核酸との強固な結合が示唆された。

ゲノム解析: 23,488個の差次的発現領域とテロメア・ミトコンドリアDNAの濃縮: RNA-seqとスライディングウィンドウ法を用いた解析により、HL-60およびdHL60細胞とecTrap間で23,488個の差次的発現領域 (ROI) が同定された (Fig. S2, S3F)。この解析には、それぞれn=3 replicatesのサンプルが用いられた。特に、テロメアDNA (TTAGGGリピート) およびミトコンドリアDNA (mtDNA) がecTrapにおいて有意に濃縮されていることが示された (ANOVA p<0.05) (Fig. 4a, b)。テロメアDNAのカウントはecTrapで有意に増加しており、ミトコンドリアDNAの濃縮も同様に確認された。この結果は、NETsにテロメアDNAとmtDNAが選択的に放出されるという新規の現象を示唆している。これは、細胞外mtDNAがSLE、関節炎、敗血症におけるDAMP (danger-associated molecular patterns) として作用するという既報 (Caielli 2016 J Exp Med, Lood 2016 Nat Med) とも合致する。500ntのスライディングウィンドウ解析では、ミトコンドリアDNAの濃縮が位置番号ごとに明確に示され (Fig. 4c)、特定のゲノム領域が選択的にecTrapに組み込まれることが示唆された。

NETomeデータベースの公開とモデルの妥当性: 本研究で得られたRNA-seqの生データおよび処理済みデータはNCBI SRA (PRJNA587717) に、プロテオミクスの生MSファイルおよびMaxQuant出力はPRIDE (PXD016143) に、さらにアノテーション付きの処理済みデータテーブルはFigshareにそれぞれ預託された。これらのデータはFAIR原則に準拠しており、NETs関連疾患のバイオマーカーや治療標的の同定に向けた研究コミュニティの貴重なリソースとなる。公開されているNETs関連既報データ (Urban 2009, O’Donoghue 2013, Chapman 2012) とのメタ解析も可能であり、SLE、COPD、COVID-19、糖尿病におけるNETs研究の参照ベースラインとして機能することが期待される。dHL60細胞と初代ヒト好中球のデータとの比較では、プロテオミクスデータにおいて80%以上のオーバーラップが確認され、本モデルの妥当性が裏付けられた。例えば、MPOやS100A8/A9といった主要なNETsマーカーは、dHL60 ecTrapと初代好中球NETsの両方で高発現していた。また、PMA刺激によるecTrap形成の動態解析では、MitoSOXアッセイにより2.5時間でROS産生がピークに達し、ecTrap形成に先行することが示された (Fig. 1d)。これは、NETs形成におけるミトコンドリアの関与を支持する結果である。

考察/結論

本Scientific Data 2022 Data Descriptorは、初のヒトNETsゲノムおよびプロテオーム統合マルチオミクスデータベース「NETome」を公開資源として構築した。HL-60細胞をdHL60細胞に分化させ、PMA刺激によりecTrapを産生するin vitro標準化システムと、Illumina NovaSeqおよびLC-MS/MS Orbitrapを組み合わせることで、2,364個のタンパク質、23,488個のゲノムROI、およびテロメア/mtDNAの濃縮を含む包括的な分子プロファイルが明らかになった。これらのデータはNCBI SRA、PRIDE、Figshareの3つの公開データベースに預託されている。

先行研究との違い: これまでのNETsプロテオミクス研究は、数十種類のタンパク質に限定された小規模なものであったが、本研究はBenzonase処理を導入することで、2,364個という桁違いに多くのタンパク質を同定し、NETsの分子組成に関する理解を大幅に拡張した点で、これまでの研究と大きく異なる。また、ゲノムレベルでのテロメアDNAおよびミトコンドリアDNAの濃縮という新規の所見は、従来のNETs研究では十分に検討されていなかった側面であり、NETsの形成メカニズムや病態生理における新たな知見を提供する。

新規性: 本研究で初めて、NETsにテロメアDNAとミトコンドリアDNAが選択的に濃縮されていることをゲノムワイドに示した。これは、細胞外DNAがDAMPとして機能するという概念を裏付けるものであり、NETsが単なる核DNAの放出だけでなく、細胞内の特定のゲノム要素を動員している可能性を新規に示唆する。また、RNA結合タンパク質の濃縮は、ecTrapが染色体足場だけでなく、細胞内RNAも含む可能性を新規に示唆している。これらの発見は、NETsの生物学的機能と病態生理における役割に関する理解を深める上で極めて重要である。

臨床応用: 本データベースは、NETs関連疾患(SLE、COPD、糖尿病、COVID-19、敗血症など)の新規バイオマーカー探索の基盤となる。例えば、血漿中の特定のNETs関連タンパク質やDNA断片を測定することで、疾患の診断、予後予測、治療効果モニタリングが可能となる。さらに、DNase I (Pulmozyme)、PAD4阻害剤 (GSK484, JBI-589)、好中球エラスターゼ阻害剤 (alvelestat) など、NETsを標的とした治療薬開発のためのターゲットバリデーションリソースとしても有用である。これにより、自己免疫疾患における精密医療の実現や、細胞外mtDNAおよびテロメアDNAをDAMPとする新規バイオマーカーコンセプトの確立に貢献する臨床的意義を持つ。

残された課題: 本研究の限界として、(i) HL-60細胞株が初代ヒト好中球を完全に再現するわけではないこと、(ii) PMA刺激がNOX (NADPH oxidase) 依存性NADPH媒介性NETsに限定され、vital NETosisやPAD4駆動型NETsなどの異なるNETosis経路のプロファイルを欠如していること、(iii) 単一時点 (4時間PMA) のみでの解析であり、NETs形成の動態プロファイルが不足していること、(iv) 細菌、ウイルス、真菌などの特定の病原体刺激に対するNETsプロファイルが未解析であること、(v) シトルリン化、リン酸化、アセチル化などの翻訳後修飾 (PTMs) の包括的解析が未実施であること、(vi) NETsネットワーク内のタンパク質分布を明らかにする空間プロテオミクスが未実施であることなどが挙げられる。今後の検討課題として、これらの限界を克服し、より生理学的に関連性の高いNETs形成モデルや刺激条件を用いた多角的解析が求められる。

方法

細胞モデルとecTrap誘導: HL-60前骨髄球性白血病細胞株 (ATCC CCL-240) を、1.5% DMSOで4日間処理することにより、dHL60好中球様細胞に分化させた。dHL60細胞は、中性前骨髄球様の形態、CD11b/CD66bの発現上昇、食作用、および脱顆粒能を獲得したことを確認した。ecTrapの誘導には、1,000 nMのPMAを4時間処理した。その後、DNase I処理により細胞を含まないecTrap上清を回収した。このプロトコルは、初代好中球のNET形成を模倣し、再現性の高いecTrap産生を可能にするために最適化された。

ゲノム解析 (RNA-seq): HL-60、dHL60、およびecTrapの3条件について、それぞれテクニカル・トリプリケートを用いてRNA-seqを実施した。Illumina NovaSeq 6000プラットフォームを使用し、47xカバレッジでシーケンスを行った。得られたfastqファイルはCLC Workbench (v11) に入力し、3’末端から15ntのプライマー配列を除去し、qスコア<25のリードをトリミングした。その後、ヒトゲノム (hg38, CLC v12) にマッピングし、STAR alignerとDESeq2を用いて差次的発現解析を行った。ゲノム領域の濃縮解析には、20、100、500、5,000ntのスライディングウィンドウ法を適用し、テロメアDNA、ミトコンドリアDNA、および遺伝子5’UTR/3’UTRの濃縮を検出した。統計的有意性はANOVAを用いて計算した (p<0.05)。この解析は、NETomeのゲノム構成を詳細に解明することを目的とした。

プロテオミクス: ecTrapタンパク質の調製には、Benzonase処理ありと処理なしの2条件を設定した。Benzonase処理は、DNA/RNAを消化し、核酸に結合したタンパク質の検出効率を向上させる目的で行われた。LC-MS/MSはOrbitrap (Thermo Q Exactive HF) を用いて実施した。タンパク質の同定と定量はMaxQuantとPerseusソフトウェアスイートを用いて行い、UniProtヒトデータベース (20,413配列) を参照した。ペプチドおよびタンパク質の同定は、偽発見率 (FDR) が1%以下の場合のみ採用した。統計的有意性はANOVAを用いて計算し、Permutation FDR <0.05を閾値とした。Benzonase処理を行ったecTrapサンプルはn=3 replicates、非処理サンプルはn=3 replicatesで解析された。

公開データ: RNA-seqの生データおよび処理済みデータはNCBI SRA (BioProject ID: PRJNA587717) に、プロテオミクスの生MSファイルおよびMaxQuant出力はPRIDE (Proteomics Identifications Database, PXD016143) に、処理済みデータテーブルはFigshareにそれぞれ預託した。これにより、FAIR (Findable, Accessible, Interoperable, Reusable) 原則に準拠したデータ公開を実現した。

メタ解析: 公開されているNETs関連RNA-seqおよびプロテオミクスデータセット (Urban 2009, O’Donoghue 2013, Chapman 2012など) との比較および検証を行った。dHL60細胞と初代ヒト好中球のデータとの比較では、プロテオミクスデータにおいて80%以上のオーバーラップが確認された。これにより、本in vitroモデルの生理学的関連性が裏付けられた。