• 著者: Fransiskus X. Ivan, Roy E. Welsch, Vincent T. K. Chow, Jagath C. Rajapakse
  • Corresponding author: Jagath C. Rajapakse (Bioinformatics Research Centre, Nanyang Technological University [NTU], Singapore; asjagath@ntu.edu.sg)
  • 雑誌: IEEE Engineering in Medicine and Biology Society (EMBS) Annual Conference
  • 発行年: 2011
  • Epub日: 2011-08-30
  • Article種別: Original Article (Conference Proceedings)
  • PMID: 22255707

背景

好中球 (neutrophils) は自然免疫系の主力細胞だが、循環中の半減期約6-8時間という短寿命と末梢血由来 primary 細胞の再現性制約のため、in vitro研究では分化誘導可能な不死化細胞株が広く用いられる。MPRO (mouse promyelocyte) 細胞株 は遺伝子改変により骨髄細胞へ truncated retinoic acid receptor α (RARα403) gene を導入した GM-CSF 依存性 promyelocyte (ATCC CRL-11422) で、all-trans retinoic acid (ATRA) を添加すると成熟好中球様細胞に分化する。先行研究では、Lian et al. Blood 2002がMPRO 分化過程のgenomic / proteomic解析で骨髄分化プログラムを記述し、Gaines et al. JLeukocBiol 2005はMPRO由来好中球が chemotaxis・respiratory burst・phagocytosis 等の機能性を保持することを示した。さらにBrinkmann et al. Science 2004の neutrophil extracellular traps (NETs) 発見以降、MPRO 由来 NEUTs (induced-differentiated MPRO cells) でも NETs 形成が報告された。しかし ATRA 誘導分化は同期的でなく、培養後は promyelocyte・myelocyte・metamyelocyte・band cell・mature neutrophil の 5 分化段階が混在する heterogeneous pool となり、好中球割合の定量評価が必須である。従来法は (1) 血液学者による手動ギムザカウント (observer bias と高分散)、(2) フローサイトメトリー (anti-Ly-6G PerCP-Cy5.5抗体使用、高精度だが抗体・機器コスト・サンプル消費大) の2択。何が足りなかったか:低コスト・客観的・high-throughput な automated 代替法は未確立であり、特に MPRO に最適化された image-based 定量パイプラインは存在しなかった。

目的

ギムザ染色 MPRO 分化細胞 (NEUTs) 画像から成熟好中球の割合を 自動画像解析 + 機械学習 で推定するシステムを開発し、(1) フローサイトメトリーとの一致性、(2) 手動カウントに対する精度・variance 優位性、(3) mRMR + k-nearest neighbor (k-NN) の最適 hyperparameter (k値・特徴数) を実験的に決定することを目的とした。

結果

所見1:NEUTs の細胞分化段階の高い多様性 (best track B: cell stages identified):ATRA 添加後 day 1 と day 3 の NEUTs ギムザ染色 image (Figure 1) で promyelocyte (核球状、cytoplasm 濃紫色)、myelocyte (核球状、cytoplasm より透明)、metamyelocyte (核 indent、broad-bean shape)、band cell (核帯状)、mature neutrophil (multi-lobed 2-5 lobes) の5 分化段階の混在を確認、さらに intermediate stages + mitotic promyelocyte/myelocyte + 稀な eosinophil分化も観察された。これは血液 mature neutrophil 純粋集団とは構造的に異なる。

所見2:反復全体閾値処理による cluster→single-cell 分割 (best track B: segmentation iterations):cytospin sample の cell cluster (overlapping cells) に対し iterative global image thresholding (Otsu + CLAHE) を 2 iterations 適用し、bigger cluster → smaller cluster → single cell の段階的分割を達成 (Figure 2)。size threshold で cell debris と multi-cell image を除去し、downstream classifier input を single-cell 限定にすることに成功した。

所見3:k-NN 分類器の hyperparameter 最適化 (best track A: optimal k + 100 repeat experiments):n=1000 manually selected single-cell images (500 neutrophil + 500 non-neutrophil、n=3 biological replicates of MPRO cultures) を 40%/60% train/test split。k=1-20 で test error を比較し、k=10 で最良性能を確認 (Figure 3A、n=100 independent experiments、mean ± SD)。全 68 features 使用時の mean test error 0.105 (10.5%) に対し、mRMR top-8 features 選択後は mean test error 0.083 (8.3%) に約1.27-fold有意改善 (Figure 3B、p<0.05、n=100 repeats)。選択された top-8 features は (1) perimeter/area ratio、(2) centroid location、(3) cytoplasm 平均強度、(4) Zernike moment 2-0、(5) Zernike moment 4-0、(6) solidity、(7) area、(8) Zernike moment 6-4 で、7 features が核由来であった。Recall/precision (Figure 3C) では neutrophil class で recall > precision、non-neutrophil class で precision > recall を示した。

所見4:自動システムとフローサイトメトリーの一致 + 手動カウントの過大評価 (best track B: 6 cultures × 2 repeats with paired n):6 NEUTs cultures × 2 repeats (計 12 比較) で flow cytometry (n=20,000 events / culture、Table 1) と automated estimation (n=442-1,191 cells / FOV pool) と manual counting (n=155-310 cells / slide) を比較。Flow cytometry neutrophil proportion 範囲 8.5-15.7% に対し、automated は 5.6-19.1% で大半が flow と comparable、manual は 8.8-31.0% で過大評価 + 高分散 (Pearson r2: automated-flow 強相関、manual-flow 中等度相関、p<0.05)。Culture 1 例: flow 12.7% vs automated 18.7%/19.1% vs manual 24.8%/31.0%、Culture 5: flow 8.5% vs automated 7.6%/8.6% vs manual 12.7%/12.3%。手動カウントの過大評価は混合領域 (neutrophil + non-neutrophil 混在) を選好する観察者 bias に起因し、cell数小規模 (155-310 vs flow 20,000) が variance を増幅した。

所見5:パイプラインの実用性とコスト効率:ギムザ染色は universal stain で追加抗体・蛍光色素不要、prep time 約10分 (flow cytometry の anti-Ly-6G staining 30分以上に対し短時間)、光学顕微鏡 + image scanner で取得可能なため low-cost / high-throughput screening に適する。flow cytometry は数秒で数千細胞解析可能だが抗体・cytometer・専門技術が必要で、抗体の種間限定 (anti-mouse Ly-6G ヒト不適応) や pan-leukocyte 交差反応の問題を回避できる image-based 代替法として実用的価値が示された。

考察/結論

本研究はMPRO分化 culture の好中球割合推定に対し、自動画像解析 (ギムザ染色 + 形態特徴 + mRMR + k-NN) がフローサイトメトリーと同等精度を低コストで達成し、手動カウントより bias / variance 両面で優れることを示した。先行研究との違いLian et al. Blood 2002がMPROの分化プログラムをgenomic/proteomicレベルで網羅したのに対し、本研究は image-based phenotype quantification という異なる切り口で MPRO研究のQC を確立した。Ceelie 2007 (Diffmaster Octavia / Cellavision DM96) の自動末梢血スメア顕微鏡システムは human peripheral blood に最適化されているのと対照的に、本研究は mouse MPRO 分化系という独自 cell context で algorithm + training data を再構築した。新規性:(1) MPRO + mRMR + k-NN を組み合わせたnovelな自動 phenotyping パイプラインを本研究で初めて確立、(2) Zernike moments + perimeter/area + centroid location という新規な8特徴で 8.3% test error の高精度を達成、(3) 6 cultures × 2 repeats で flow / automated / manual の三方比較をこれまで報告されていない実証スケールで提示した。臨床応用:(1) MPRO 分化効率 optimization による ex vivo NETs / ROS / chemotaxis assay の precision QC、(2) 重症先天性好中球減少症 (severe congenital neutropenia, SCN; ELANE / CSF3R mutation) の分子機構研究モデルの QC、(3) 他造血 progenitor 細胞株 (HL-60、NB4、EPRO) 分化評価への transfer のbench-to-bedside展開可能性、(4) drug screening (anti-MPN 薬、analogous compound)で臨床的有用性を持つtranslational preclinical platform を提供。残された課題:(1) k-NN は feature 数と training sample 数に依存し、convolutional neural network (CNN) ベース modern method (CellProfiler、DeepCell、Stardist) との比較未実施、これらとの精度比較は今後の検討、(2) MPRO 特異的で他細胞株 (HL-60、NB4) への direct transfer 未検証、(3) 8.3% 誤差率は apoptotic cell / stained debris で増加する可能性 (limitation)、(4) 3+ classes (promyelocyte / myelocyte / metamyelocyte / band cell / mature) への拡張で test error が 30% に上昇する技術課題のfuture改善、(5) deep learning 統合・larger training cohort (n>10,000) での scaling validation が残された課題として残されている。本研究は2011年発表で pre-deep-learning era の classical morphology-based ML approach のリファレンスとして、Rajapakse group (NTU Singapore) の生物医学画像解析研究の早期実証例である。

方法

細胞 (cell line):MPRO cell line (mouse promyelocyte、ATCC CRL-11422、cell catalog ID) を Isocove’s modified Dulbecco’s medium (IMDM、4 mM L-glutamine、1.5 g/L sodium bicarbonate、10 ng/mL murine GM-CSF、20% heat-inactivated fetal bovine serum [FBS]) で 37°C・5% CO2 atmosphere培養。マウス株 (mouse origin):MPRO は C57BL/6 mouse bone marrow-derived 遺伝子改変 cell line (RARα403 truncated retinoic acid receptor α 遺伝子insertion) に由来する。ATRA 分化誘導:10 μM all-trans retinoic acid (ATRA、Sigma) を培地に添加、5日以内に viability >90% (trypan blue exclusion) を確認した分化細胞 (induced-differentiated MPRO cells, NEUTs) を回収した。フローサイトメトリー:NEUTs を phosphate-buffered saline (PBS) で洗浄後、anti-mouse PerCP-Cy5.5 rat anti-mouse Ly-6G (BD Pharmingen) で 4°C・20分インキュベート、Cytomics FC500 Series Flow Cytometry System (Beckman Coulter) でLy-6G+ 好中球を取得 (n=20,000 events per culture)、WinMDI v2.9で解析。ギムザ染色と imaging:MPRO または NEUTs サンプル (50 μL、2.5-5.0×10^4 cells) を slide に May-Grünwald-Giemsa cytospin staining で固定し、MIRAX MIDI slide scanner (Carl Zeiss, Germany) でブライトフィールド全領域 scan、40× magnification で field of view (FOV) ごとに sub-image を抽出。画像解析パイプライン:(1) RGB → grayscale 変換、contrast-limited adaptive histogram equalization (CLAHE、Zuiderveld 1994) で contrast改善、(2) Otsu’s method (1979) で global thresholding を反復実行し細胞領域同定、(3) 小オブジェクト除去 + hole filling、bounding box 抽出、size threshold で single-cell vs cluster 分類、(4) 反復的 thresholding (typically 2 iterations) で cluster を single-cell に分割、(5) Four-level Otsu segmentation で nucleus / cytoplasm 区別。特徴抽出 (feature extraction):核領域から 61 morphological features (30 Zernike moments [Boland 1998 reference]、area、perimeter、solidity、circularity、eccentricity)、グレースケール nucleus / cytoplasm pixel intensity statistics 7 features を計 68 次元抽出。特徴選択 (feature selection):minimum-Redundancy Maximum-Relevance (mRMR、Peng 2005 reference [PMID 16119262]) で最適特徴 (順位付き) を選択。分類器 training:手動選別 single-cell images n=1000 (mature neutrophil 500 + non-neutrophil 500) を用い、各 class から 40% を training data、60% を test data に random split、k-nearest neighbor (k-NN) を training、k=1-20 で test error 推奨値を実験的決定。評価:6 cultures × 2 replicates の cytospin slide で 10 FOVs (中心 + 4 corner各2) を 40× で sampling、blinded manual cell counting と比較。統計:100 experiments の test error mean ± SDで evaluation、Pearson r で flow cytometry vs automated vs manual の相関を比較。