- 著者: Gustaf Wigerblad, Qilin Cao, Stephen Brooks, Faiza Naz, Manasi Gadkari, Kan Jiang, Sarthak Gupta, Liam O’Neil, Stefania Dell’Orso, Mariana J. Kaplan, Luis M. Franco
- Corresponding author: Luis M. Franco (luis.franco@nih.gov); Mariana J. Kaplan (mariana.kaplan@nih.gov) (Systemic Autoimmunity Branch, National Institute of Arthritis and Musculoskeletal and Skin Diseases, National Institutes of Health, Bethesda, MD, USA)
- 雑誌: The Journal of Immunology
- 発行年: 2022
- Epub日: 2022-08-15
- Article種別: Original Article
- PMID: 35858733
背景
好中球はヒト末梢血中で最も豊富な白血球であり、自然免疫系の必須構成要素である。従来、好中球は均一で転写的に不活性な細胞であると考えられてきたが、近年、この両方の概念が強く疑問視されている。単一細胞RNAシーケンス (scRNA-seq: single-cell RNA sequencing) 技術は、細胞の転写状態の連続体を偏りなく観察する機会を提供する。しかし、scRNA-seqを用いた好中球の特性評価は技術的に困難であることが判明しており、これが好中球に関する公開された単一細胞データが不足している一因である。
近年、T細胞やマクロファージといった細胞種において、細胞が異なる状態へと変換し、混合型または部分的なプロファイルを示すことが示され、細胞の不均一性と可塑性に関する理解が急速に変化している。このことは、造血細胞が分化および活性化状態の連続体として理解されるべきであることを示唆している。好中球の不均一性の概念は、Ng et al. NatRevImmunol 2019のレビューで詳細に議論されており、単一細胞シーケンス技術が好中球の状態をより包括的かつ偏りなく特徴づける有望な手段であると提案されている。
先行研究では、マウスモデルや限られたヒトサンプルを用いて、循環好中球および骨髄好中球のscRNA-seq解析が行われ、転写状態の多様性が報告されている (Grieshaber-Bouyer et al. NatCommun 2021, Xie et al. NatImmunol 2020)。我々のグループや他の研究者も、健常ドナーの好中球における性差や、肺がん患者 (Zilionis et al. Immunity 2019) におけるscRNA-seq研究で、ヒト好中球の転写サブセットの存在を報告している。しかし、他の細胞種と比較してRNA含量が低いという特性のため、ヒト好中球のscRNA-seqは依然として技術的に困難であり、ヒト好中球を記述するscRNA-seq報告が他の造血細胞種と比較して著しく不足している。この技術的な課題を克服し、好中球の転写状態の全貌を明らかにするための、より適切な解析パイプラインの開発が未解明なままであった。特に、標準的なscRNA-seq解析パイプラインでは、好中球が著しく過少に代表されるというギャップが残されている。好中球の転写状態の全貌や、その詳細な不均一性については依然として未解明な部分が多く、ヒト好中球の単一細胞レベルでの転写プロファイルに関する知見は著しく不足しているのが現状である。
目的
本研究の目的は、ヒト循環好中球のscRNA-seqデータにおいて好中球を適切に同定するための解析パイプライン修正法を開発することである。この修正パイプラインを用いて、健常ドナーから精製された循環好中球の転写状態の全貌を明らかにすることを目的とした。具体的には、好中球を転写的に分類し、同定された転写クラスターが従来の表面マーカーとどのように関連するかを検証することを目指した。また、開発したパイプラインが他の組織由来のscRNA-seqデータにおける好中球の同定を改善できるか、および全身性エリテマトーデス (SLE: systemic lupus erythematosus) 患者の低密度顆粒球 (LDG: low-density granulocyte) の解析に応用可能かを評価することも目的とした。これにより、好中球の不均一性に関する新たな知見を提供し、健康および疾患における好中球の特性評価に貢献することを目指した。
結果
修正解析パイプラインによる好中球検出効率の大幅な向上: 標準Cell Rangerパイプラインを用いた全血scRNA-seq解析では、フィルタリング済みマトリックスにおいて好中球が27.2%しか同定されなかった (Fig 1A)。しかし、修正パイプライン (未フィルタリングマトリックスと低閾値細胞呼び出し) を適用することで、好中球の割合は58.7%に増加した (Fig 1C)。この改善は、赤血球枯渇全血、密度勾配遠心分離顆粒球、免疫磁気精製好中球の3通りの好中球精製方法すべてで有効であり、7名の健常ドナー間で有意差が認められた (p=0.0034) (Fig 1F)。同様に、既発表の重症COVID-19気管支肺胞洗浄液データセット (n=1 dataset) でも、標準パイプラインで13.1%であった好中球の割合が、修正パイプラインでは55.8%に改善した (Fig 1G)。救出された細胞は、FCGR3B、CSF3R、NAMPTなどの好中球マーカー遺伝子を高発現しており、その同一性が確認された (Fig 1E)。FCGR3Bの遺伝子発現は他細胞と比較して 5.0-fold 以上高かった。この結果は、標準的な手法では見逃されていた多数の好中球が、改良された解析によって効率的に回収され、その転写プロファイルが好中球に特異的であることを明確に示している。
健常人循環好中球における4つの再現性ある転写クラスターの同定: 修正パイプラインを用いて、免疫磁気精製された合計 n=72183 cells の循環ヒト好中球を解析した結果、7名の健常ドナー間で高い再現性を示す4つの明確な転写クラスターが同定された (Nh0〜Nh3と命名) (Fig 2E, 2F)。これらのクラスターは各ドナーにおいて安定した比率で存在し、Nh0クラスターが平均22.1% (範囲 14.4-30.1%)、Nh1クラスターが平均57.1% (範囲 40.3-71.3%)、Nh2クラスターが平均13.6% (範囲 5.8-41.0%)、Nh3クラスターが平均7.2% (範囲 3.8-12.6%) を占めた。
各転写クラスターに特異的な遺伝子発現プロファイルとタンパク質レベルでの検証: 各クラスターは独自の遺伝子発現プロファイルを示した (Fig 3A)。Nh0クラスターは骨髄好中球に類似した未成熟表現型を示し、MMP9、ITGAM、FCN1、CAMP、CYBB、CST3、VIM、TXN、S100ファミリー (S100A6/A8/A9/A11/A12) などの遺伝子が高発現していた。Nh1クラスターは最多の中間型クラスターであり、AIF1、CXCR2、TXNIPが高発現していた。Nh2クラスターは、長鎖ノンコーディングRNAであるMALAT1およびNEAT1、G-CSF受容体CSF3Rの高発現を特徴としたが、全体的な転写出力が低く、遺伝子数が少なかった。Nh3クラスターは、HERC5、IFI16、IFIT1、IFIT2、IFITM2、IFITM3、ISG15などのI型IFN誘導遺伝子群が著しく高発現する非常に特異的な細胞状態を示した。単一細胞ウェスタンブロットにより n=3300 cells の好中球を解析した結果、ISG15やIFITM3を高レベルで発現する個別の好中球サブセットが離散的に検出され、その割合は約7%で、scRNA-seqの結果と一致した (Fig 3E)。
CITE-seqによる転写クラスターの表面マーカー独立性の実証: CD10、CD11b、CD11c、CD14、CD15、CD16、CD24、CD33、CD35、CD45、CD66b、CD107a、CD184、HLA-DRの14種類の表面タンパク質を転写産物と同時定量するCITE-seq解析を実施した。その結果、これら14種すべての表面タンパク質の発現量はNh0〜Nh3クラスター間で類似しており、有意差がなかった (Fig 3H, Supplemental Fig 3)。このことは、4つの転写クラスターが、従来用いられてきた表面マーカーでは区別できない好中球の不均一性を反映していることを示している。この発見は、好中球の分類において転写プロファイルが表面マーカーよりも詳細な情報を提供することを示唆する。
Monocle3による発生軌道解析と転写因子活性の推定: Monocle3を用いた擬時間軌道解析では、Nh0 (未成熟) を根 (root) として発生軌道が描かれ、Nh1 (中間状態) を経てNh2またはNh3が2つの異なる終端状態を形成することが示された (Fig 4A)。5種の共発現遺伝子モジュールが同定され (Fig 4B), モジュール1はNh0特異的、モジュール3はNh2特異的、モジュール5はNh3特異的であった。BARTを用いた転写因子活性の推定では、Nh2とNh3クラスターに最多の固有転写因子が予測された (Fig 4D)。Nh1からNh3への移行では、NFκB関連転写因子の発現上昇が特徴的であった。一方、Nh1からNh2への移行では、転写抑制因子FOXP1とメチルシトシン二酸化酵素TET2・TET3の発現上昇が見られた (Fig 4E)。これらの転写因子タンパク質は、既発表の n=5 donors 由来好中球のバルク質量分析データでも検出された (Fig 4F)。
SLE低密度顆粒球 (LDG) におけるNhクラスター分布とIFN応答の解析: 健常ドナーのNh0〜Nh3分類をSLE患者由来LDG (n=3 patients) に適用したところ、LDGは4つのNhクラスターすべてに分布し、健常対照とNhクラスター比率が類似していた (Fig 5A, 5B)。しかし、IFN誘導遺伝子発現のスコアはLDGの全クラスターで全般的に上昇しており、SLEの高IFN状態はNh3クラスターの割合増加ではなく、すべてのクラスターにおけるIFN遺伝子発現の全体的な増加によるものであることが示された (Fig 5C, 5D, 5E)。SLE LDGにおけるIFN誘導遺伝子の発現上昇 (log2FC 1.5 以上) が確認された。具体的には、SLE LDGではIFNシグナル伝達およびNFκBシグナル伝達に関連する遺伝子の発現が上昇しており、これはSLE患者の単核細胞におけるI型IFNシグナル伝達の過活動性に関する既報の知見と一致する。
考察/結論
本研究は、ヒト循環好中球が転写的に不均一な細胞であり、健常人から得られた72,183個の細胞を用いて、4つの再現性のある転写クラスター (Nh0〜Nh3) に分類できることを系統的に示した。これらのクラスターは、従来の表面マーカーでは識別不可能であり、scRNA-seqが好中球生物学の新たな視点を提供することが示された。この発見は、単一の「成熟好中球」という均一性の仮定から、より連続的な転写スペクトルを持つ細胞群としての好中球理解への大きな概念的転換を意味する。
先行研究との違い: 本研究は、これまでの研究で好中球の転写不均一性が示唆されてきたものの、その技術的な困難さから、ヒト好中球のscRNA-seqデータにおける適切な同定と系統的な分類が不足していた状況と異なる。標準的なscRNA-seq解析パイプラインが好中球を著しく過少代表する問題を特定し、未フィルタリングマトリックスからの修正パイプラインを確立した点で、これまでの報告と異なる。この修正は、好中球scRNA-seqの標準化に向けた実用的なガイドラインを提供し、今後の疾患研究での好中球解析の基盤となる。
新規性: 本研究で初めて、健常人循環好中球がNh0 (未成熟)、Nh1 (中間型)、Nh2 (転写不活性)、Nh3 (I型IFN応答性) の4つの明確な転写クラスターに分類されることを新規に同定した。また、Monocle3を用いた軌道解析により、Nh0からNh1を経てNh2とNh3が2つの異なる終端状態を形成するという発生軌道モデルを提示したことも、これまで報告されていない重要な発見である。さらに、これらの転写サブセットが従来の表面マーカーとは独立していることをCITE-seqにより実証したことも新規な知見である。
臨床応用: 本研究で確立した健常ドナーのNhクラスター分類は、疾患状態の好中球データを解釈するための参照フレームを提供するという臨床的意義を持つ。SLE患者の低密度顆粒球 (LDG) の解析に応用した結果、LDGは健常好中球と同様のNhクラスター分布を示すものの、I型IFN誘導遺伝子の発現が全クラスターで全体的に上昇していることが判明した。これは、SLEにおけるIFN過活性化が特定の好中球サブセットの増加によるものではなく、すべての好中球クラスターにおけるIFN応答の全体的な増加によるものである可能性を示唆しており、疾患メカニズムの理解に新たな洞察を与える。
残された課題: 今後の検討課題として、各転写クラスターの機能的差異 (例: Nh3細胞の抗菌活性やネットーシス能) の実験的検証が挙げられる。また、表面マーカーを用いない転写クラスター別の細胞分離法の開発も重要である。異なる疾患 (感染症、自己免疫疾患、がん) における好中球Nhクラスター比率の変化や、環境的・薬理学的刺激に対する応答の系統的解析も今後の研究方向性となる。さらに、本研究は10× GenomicsのscRNA-seq技術に限定されているため、他のscRNA-seq技術への修正解析パイプラインの適用可能性の検証も残された課題である。
方法
好中球の精製とscRNA-seq: NIHクリニカルセンターの7名の健常ドナーから、EasySep Direct Human Neutrophil Isolation Kit (STEMCELL Technologies社製) を用いた免疫磁気陰性選択により好中球を精製した。細胞の純度、生存率、および早期アポトーシスは、フローサイトメトリーによりCD16、CD45、CD66b、LIVE/DEAD Fixable Dead Cell Stain Kit (生細胞/死細胞染色キット)、およびPE-Annexin V (phycoerythrin-conjugated Annexin V: フィコエリスリン結合アネキシンV) を用いて確認した。約50,000個の細胞を10× Genomics Chromium Comptroller Instrumentにロードし、Chromium Single Cell 3’ Library & Gel Bead Kit v3.1 (10× Genomics社製) を用いて単一細胞cDNAおよびライブラリを調製した。シーケンスはNextSeq500またはNovaSeq6000 (Illumina社製) シーケンサーで実施した。プロテアーゼ阻害剤またはRNase阻害剤の添加は、最終的なcDNA濃度を増加させなかった。本研究はヒト初代細胞を対象としたが、一般的な培養細胞株である HEK293T (ヒト胎児尿路上皮由来細胞株) や A549 (ヒト肺胞上皮がん細胞株) などのデータ処理とは異なる閾値設定が必要である。また、C57BL/6J などの標準的なマウス系統から得られた細胞を対象とする標準的なCell Rangerのアルゴリズムとも異なるアプローチを用いた。
修正解析パイプライン: IlluminaのFASTQファイルはCell Ranger mkfastq v4.0.0およびIllumina bcl2fastq v2.20でデマルチプレックスされ、Cell Ranger count v4.0.0とrefdata-gex-GRCh38-2020-A参照ゲノムを用いてリードカウントおよび解析が行われた。標準Cell Rangerパイプラインの「フィルタリング済みマトリックス」は細胞呼び出し閾値が高く好中球を除外する傾向があるため、本研究では「未フィルタリングの生マトリックス」から出発し、バーコードあたりの特徴量 (遺伝子数) の頻度分布に基づいて閾値を低く設定する修正パイプラインを開発した。Seurat v4.0.1を用いて、遺伝子数が100〜2500、ミトコンドリア遺伝子比率が0.1未満の細胞を選択し、LogNormalize法で正規化、FindVariableFeatures()関数で上位2000の可変遺伝子を選択した。スケーリング後、主成分分析とクラスタリングを実施し、UMAP (uniform manifold approximation and projection: 均一多様体近似と投影) v0.2.7.0で可視化した。SingleR v1.4.1で細胞同定を行った。統計解析には、群間比較に Mann-Whitney U test (Mann-Whitney U検定) および Student t-test (Studentのt検定) が用いられた。
細胞状態軌道解析と転写因子推定: Monocle3 (Rパッケージ v0.2.3.0) を用いて、UMAP投影上に主グラフを学習し、order_cells()関数で細胞を擬時間軸に沿って順序付けした。graph_test()関数で細胞群間で変動する遺伝子を同定し、find_gene_modules()関数で共発現遺伝子モジュールを特定した。BART (binding analysis for regulation of transcription: 転写制御のための結合解析) パイプラインを用いて、各モジュールの共発現遺伝子リストから転写因子活性を推定した。
CITE-seq: TotalSeq-Bオリゴヌクレオチド結合抗体 (BioLegend社製) を用いて、CD45、CD14、CD33、CD11c、CD10、CD16、CD107a、HLA-DR、CD11b、CD66b、CD35、CD24、CD184、CD15の14種類の表面タンパク質と転写産物を単一細胞レベルで同時定量するCITE-seq (Cellular Indexing of Transcriptomes and Epitopes by Sequencing: シーケンスによるトランスクリプトームとエピトープの細胞インデックス化) 解析を実施した。
単一細胞ウェスタンブロット: ProteinSimple社のscWestチップとMilo機器を用いて、2名のドナー由来3,300個の好中球でISG15およびIFITM3タンパク質を検出した。GAPDH (glyceraldehyde-3-phosphate dehydrogenase: グリセルアルデヒド-3-リン酸脱水素酵素) をローディングコントロールとして使用した。
SLE LDG解析: 既発表の公開データセットから得られたSLE患者の低密度顆粒球 (LDG) の生scRNA-seqデータに修正パイプラインを適用し、健常対照と比較した。データはGEO登録番号GSE188288でアクセス可能である。