- 著者: Michal Slyper, Caroline B. M. Porter, Orr Ashenberg, Julia Waldman, Eugene Drokhlyansky, Isaac Wakiro, Christopher Smillie, Gabriela Smith-Rosario, Jingyi Wu, Danielle Dionne, Sebastien Vigneau, Judit Jane-Valbuena, Timothy L. Tickle, Sara Napolitano, Mei-Ju Su, Anand G. Patel, Asa Karlstrom, Simon Gritsch, Masashi Nomura, Avinash Waghray, Satyen H. Gohil, Alexander M. Tsankov, Livnat Jerby-Arnon, Ofir Cohen, Johanna Klughammer, Yanay Rosen, Joshua Gould, Lan Nguyen, Matan Hofree, Peter J. Tramontozzi, Bo Li, Catherine J. Wu, Benjamin Izar, Rizwan Haq, F. Stephen Hodi, Charles H. Yoon, Aaron N. Hata, Suzanne J. Baker, Mario L. Suva, Raphael Bueno, Elizabeth H. Stover, Michael R. Clay, Michael A. Dyer, Natalie B. Collins, Ursula A. Matulonis, Nikhil Wagle, Bruce E. Johnson, Asaf Rotem, Orit Rozenblatt-Rosen, Aviv Regev
- Corresponding author: Orit Rozenblatt-Rosen (Klarman Cell Observatory, Broad Institute of Harvard and MIT, Cambridge, MA), Aviv Regev (Klarman Cell Observatory, Broad Institute / Howard Hughes Medical Institute / Koch Institute MIT)
- 雑誌: Nature Medicine
- 発行年: 2020
- Epub日: 2020-04-13
- Article種別: Original Article
- PMID: 32405060
背景
シングルセルゲノミクスは、腫瘍微小環境を構成する悪性細胞、間質細胞、免疫細胞からなる複雑な腫瘍エコシステム (tumor ecosystem) の不均一性、細胞間相互作用、および治療抵抗性機序を解明する上で不可欠な技術である。これに伴い、Human Tumor Atlas Network (HTAN) などの大規模な腫瘍アトラス計画が世界的に始動している。しかし、臨床現場から得られる腫瘍検体に対してシングルセルゲノミクスを適用するには、依然として多くの技術的課題が存在する。
従来の scRNA-Seq (single-cell RNA sequencing) では、新鮮な組織 (fresh tissue) を迅速に単一細胞へ解離 (dissociation) させる必要があるが、腫瘍タイプごとに細胞外マトリックス (ECM (extracellular matrix)) の組成が異なるため、画一的なプロトコルでは対応できない。不適切な解離プロトコルは、酵素消化に対する感受性が高い特定の細胞集団の選択的損失を招くか、あるいは細胞ストレスによる転写プロファイルの人工的な擾乱 (ストレス応答遺伝子の発現誘導など) を引き起こす。さらに、新鮮組織の確保には、臨床現場での検体採取からラボでの処理に至るまでの極めてタイトな時間的制約と高度な連携が必要であり、これが多施設共同研究や日常的な臨床試験における大きな障害となっていた。
一方、凍結組織 (frozen tissue) から単離した核を用いる snRNA-Seq (single-nucleus RNA sequencing) は、検体採取と処理のタイミングを切り離すことができるため、臨床バイオバンク検体への適用や、同一患者からの縦断的な複数検体の同時解析を可能にする。また、新鮮組織の解離が極めて困難な線維化の強い腫瘍や、巨大な腫瘍、あるいは解離プロセスで壊れやすい脆弱な細胞 (ニューロンや巨大な悪性細胞など) の解析にも適している。しかし、単一の核 (nuclei) に含まれる mRNA 量は細胞全体と比較して著しく少なく、さらに特定の細胞タイプを濃縮 (enrichment) または除去 (depletion) することが技術的に困難であるという欠点がある。
これまで、個々の腫瘍タイプや検体状態 (新鮮、凍結、生検、切除、腹水など) に応じた最適なプロトコルを体系的に比較・評価した標準化フレームワークは存在せず、どの手法を選択すべきかの決定木や評価指標が不足していた。この技術的ギャップは、大規模な腫瘍アトラス構築や臨床応用におけるデータの標準化・共同利用を阻む大きな要因となっていた。
先行研究である Jerby-Arnon et al. Cell 2018、Savas et al. NatMed 2018、および Lambrechts et al. NatMed 2018 では、特定の腫瘍タイプや細胞集団に焦点を当てた個別のプロトコル最適化が行われてきた。しかし、複数のがん種を横断して新鮮組織と凍結組織の双方に対応する包括的なプロトコルツールボックスは未確立であり、体系的な比較検証が決定的に不足していた。このため、臨床検体の特性に応じた最適な手法の選択基準が未確立であり、標準化されたプロトコルの確立が強く望まれていた。
目的
本研究の目的は、新鮮腫瘍検体に対する scRNA-Seq と、凍結腫瘍検体に対する snRNA-Seq の双方をカバーする、系統的かつ包括的なプロトコルツールボックス (toolbox) を構築することである。異なる組織学的特性や採取方法 (外科的切除検体、コア生検検体、腹水、および O-PDX (orthotopic patient-derived xenograft)) を有する複数の腫瘍タイプを対象として、実験プロトコル、クラウド基盤の計算パイプライン、および細胞型特異的な品質評価指標を統合した評価システムを確立する。これにより、研究者が自身の研究目的や検体の状態に応じて最適なプロトコルを選択できる「決定木 (decision tree)」を提供し、Human Tumor Atlas Pilot Project (HTAPP) をはじめとする国際的な腫瘍アトラスプロジェクトにおける標準的な技術基盤を確立することを目指す。具体的には、新鮮組織の解離における酵素カクテルの違いや、凍結組織における核単離バッファーの違いが、回収される細胞の多様性や品質に与える影響を定量的に明らかにし、最適なプロトコルを定義する。
結果
新鮮組織における解離プロトコルの最適化と細胞多様性の回収: 新鮮な NSCLC 切除検体 (サンプル NSCLC14、n=1 patient) を用いて、3つの解離プロトコル (NSCLC-C4、PDEC、LE) を直接比較した。標準的な品質管理指標は3つのプロトコル間で類似していたが、回収される細胞の多様性には顕著な差異が認められた。PDECおよびLEプロトコルは、腫瘍微小環境を構成する線維芽細胞や血管内皮細胞を効率的に回収できたのに対し、NSCLC-C4プロトコルではこれらの間質細胞がほとんど回収されず、回収細胞が免疫細胞に著しく偏っていた (Fig. 2e)。さらに、NSCLC-C4プロトコルでは、空のドロップレットと判定された割合 (empty drop fraction) が 7% に達し、PDEC (0.08%) およびLE (0.04%) と比較して約100倍高い値を示した (Fig. 2d) (これは fold change 100x に相当する)。細胞型特異的な品質評価において、B細胞における検出遺伝子数は PDEC プロトコルが最も高く (PDEC vs NSCLC-C4: p=2×10^-15、PDEC vs LE: p=2×10^-10、Mann-Whitney U検定)、上皮細胞における検出遺伝子数は LE プロトコルが最も高かった (LE vs NSCLC-C4: p=5×10^-6、LE vs PDEC: p=2×10^-4、Mann-Whitney U検定) (Fig. 2b)。これらの結果から、間質細胞の回収効率と細胞型特異的な品質のバランスが最も優れている PDEC を、NSCLC における推奨プロトコルとして選定した。
CD45陽性細胞除去による悪性細胞および間質細胞の効率的濃縮: 腫瘍検体中に高頻度に含まれる免疫細胞 (CD45+) を迅速に除去するため、MACSを用いた CD45+ depletion プロトコルを開発・検証した。NSCLC 切除検体 (NSCLC17、n=1 patient) において、CD45+除去処理を行うことにより、上皮細胞 (悪性細胞を含む) の割合が処理前の 26% から処理後には 82% へと大幅に上昇した (Fig. 2g)。同様に、免疫細胞が極めて優位な卵巣がん腹水サンプル (HTAPP-727、n=1 patient) においても、CD45+除去処理を適用することで、処理前には FACS (fluorescence-activated cell sorting) 解析でわずか 0.17% であった EpCAM陽性上皮細胞の割合が、処理後には scRNA-Seq データ上で 32% まで濃縮されることを確認した (Fig. 2g)。また、FACS解析による検証では、CD45+細胞の除去により非免疫細胞 (CD45-) の割合が 0.75% から 29.4% へと向上し、EpCAM+細胞の割合も 0.17% から 4.9% へと濃縮された。MACSを用いたこのアプローチは、FACSによるソートと比較して処理時間が短く、細胞ストレスを最小限に抑えながら、希少な悪性細胞や間質細胞の検出感度を大幅に向上させることが示された。
生検検体および治療後検体への適用性と臨床的ロバスト性の検証: 本ツールボックスの臨床的有用性を検証するため、外科的切除検体よりもはるかに微量なコア生検検体や、治療介入後の検体への適用を試みた。転移性乳がん (MBC) のリンパ節転移生検検体 (HTAPP-735、n=1 patient) および肝転移生検検体 (HTAPP-285およびHTAPP-963、n=2 patients) に対し、LDプロトコルを適用したところ、切除検体と同等に高品質な単一細胞データが得られ、上皮細胞、内皮細胞、線維芽細胞、およびT細胞を含む多様な細胞集団が回収された (Fig. 3e)。また、同一の神経芽腫患者から治療前に採取された生検検体 (HTAPP-312-pre、n=1 patient、n=4369 cells) と、化学療法後に切除された検体 (HTAPP-312-post、n=1 patient、n=786 cells) のマッチペア解析を実施した。さらに、検証用として O-PDX1 モデル (n=12 mice) においても高品質な悪性細胞プロファイルが得られることを確認した。治療前検体と治療後検体のいずれからも高品質なトランスクリプトームプロファイルが得られ、両者において同一のコピー数異常 (CNA) パターンを有する悪性神経内分泌細胞が同定された (Fig. 3f)。治療後検体では、治療に伴う線維化 (fibrosis) を反映して細胞回収数が減少したものの、線維芽細胞や血管内皮細胞が追加で検出され、治療による微小環境の変化を忠実に捉えることができた。
凍結組織における単一核単離プロトコルの比較とTSTの優位性: 凍結された神経芽腫切除検体 (HTAPP-244、n=1 patient、n=7415 nuclei) を用いて、4つの核単離プロトコル (EZPrep、CST、NST、TST) を直接比較した。すべてのプロトコルにおいて、約 6100 から 7900 個の高品質な核が回収され、検出された CNA パターンも極めて類似していた (Fig. 4b,e)。しかし、EZPrep プロトコルで単離された核は、他の3つの塩・Trisベース (STベース) のプロトコルと比較して、核あたりの検出 UMI 数および遺伝子数が著しく低かった (Fig. 4b)。STベースの3プロトコルの中では、TST プロトコルが最も高い細胞多様性 (血管内皮細胞、線維芽細胞、神経堤細胞、およびT細胞) を回収し、細胞型あたりの核回収数も最大であった (Fig. 4d)。一方で、TST プロトコルは、核膜や小胞体、リボソームが核に付着した状態で回収される特性を反映して、ミトコンドリア遺伝子由来 of UMI 割合が最も高くなる傾向を示した (Fig. 4b)。この傾向は、シーケンシングリード数を同一レベルにダウンサンプリングした解析 (downsampling analysis) においても同様に維持された。総合的な細胞多様性の回収能に基づき、TST プロトコルを大半の固形腫瘍における凍結組織用の標準推奨プロトコルとして決定した。ただし、小児高悪性度グリオーマ (HTAPP-443、n=1 patient) などの神経組織由来の腫瘍においては、CST プロトコルが優れたパフォーマンスを示したため、これを推奨プロトコルとした。
新鮮細胞と凍結核のマッチペア比較における細胞組成の差異: 同一の腫瘍検体から調製した新鮮細胞 (scRNA-Seq) と凍結核 (snRNA-Seq) のデータを直接比較した。神経芽腫 (HTAPP-656、n=1 patient) および転移性乳がん (HTAPP-963、n=1 patient) の双方において、CCAを用いたバッチ補正を行うことで、細胞と核のトランスクリプトームデータは細胞型ごとに極めて良好にアライメントされ、同一の細胞集団を同定することが可能であった (Fig. 6a,h)。しかし、回収される細胞型の割合 (cellular composition) には顕著なバイアスが認められた。具体的には、scRNA-Seqでは免疫細胞 (T細胞やマクロファージなど) が極めて高い割合で回収されたのに対し、snRNA-Seqでは実質細胞、特に悪性上皮細胞や間質細胞 (線維芽細胞や内皮細胞など) が有意に高い割合で回収された (Fig. 6d,k)。さらに、解離に伴う人工的な遺伝子発現変化 (dissociation signature) を評価したところ、新鮮組織から解離した細胞においてストレス応答遺伝子群の発現が有意に高かったのに対し (p < 0.001、Mann-Whitney U検定), 凍結組織から単離した核ではこれらのストレスシグネチャーが極めて低く抑えられていた。いくつかのストレス応答遺伝子 (例えば FOS や JUN) の発現は、新鮮細胞において log2FC 1.8 以上の有意な上昇を示した。また、SoupXを用いたアンビエントRNA汚染率の推定において、推定値の 95% CI 0.85-1.15 の範囲でプロトコル間の整合性が確認された。
考察/結論
先行研究との違い: 従来のシングルセル研究 (例えば Jerby-Arnon et al. Cell 2018、Savas et al. NatMed 2018、および Lambrechts et al. NatMed 2018) では、個々の研究グループが特定の腫瘍タイプや特定の細胞集団 (主に免疫細胞) に焦点を当てて独自にプロトコルを最適化しており、複数のがん種を横断して新鮮組織と凍結組織を同一の評価基準で比較した標準化フレームワークは存在しなかった。これまでの個別アプローチと異なり、本研究は8つの異なる腫瘍タイプを対象に、実験手法から計算パイプライン、細胞型特異的な品質管理 (QC) 指標に至るまでを統合した標準化プラットフォームを提示している。
新規性: 本研究で初めて、新鮮組織の酵素解離 (scRNA-Seq) と凍結組織の核単離 (snRNA-Seq) の双方において、細胞多様性の回収効率や細胞型特異的な品質 (遺伝子検出数やアンビエントRNA汚染率など) を定量的に評価するシステムを構築した。特に、標準的な QC 指標 (細胞全体の平均遺伝子数など) のみに依存した評価は、細胞組成の偏りによって誤った結論を導くリスクがあることを示し、細胞型ごとに QC を評価することの重要性を新規に提唱した。また、新鮮細胞と凍結核のマッチペア解析を通じて、両手法が同一の細胞型を回収しつつも、回収される細胞比率 (免疫細胞 vs 悪性・間質細胞) に固有のバイアスが存在することを明瞭に示した。
臨床応用: 本ツールボックスは、臨床現場におけるシングルセルゲノミクスの社会実装を強力に推進する。特に、凍結組織を用いた snRNA-Seq プロトコル (TSTなど) の確立は、世界中の多施設臨床試験で蓄積されている膨大なバイオバンク検体 (archived specimens) へのアクセスを可能にし、治療前後や縦断的な検体採取を伴う臨床研究のデザインを劇的に容易にする。また、微量なコア生検検体や治療介入後の線維化した困難検体に対しても、高品質なシングルセルデータを取得できることを実証したため、個別化医療 (precision medicine) におけるバイオマーカー探索や治療抵抗性クローンの同定といった臨床現場への直接的な translational研究 (臨床応用) に直結する。
残された課題: 今後の検討課題として、本研究で検証された8つのがん種以外の希少がんや、異なる組織学的特性を持つ腫瘍タイプ (中皮腫や胸腺腫など) への適用パラメータの拡張が必要である。また、本研究のプロトコルはドロップレットベースの 10x Genomics プラットフォームを中心に最適化されているため、他のシングルセル技術や、近年急速に発展している空間トランスクリプトミクス (spatial transcriptomics) 技術との統合プロトコルの開発が今後の課題として残されている。さらに、snRNA-Seqにおける免疫細胞の回収比率の低さを克服するための、核レベルでの特定の細胞型濃縮 (enrichment) 戦略の最適化も、今後の重要な研究方向性である。
方法
本研究では、非小細胞肺がん (NSCLC)、転移性乳がん (MBC (metastatic breast cancer))、卵巣がん、神経芽腫、膠芽腫 (GBM (glioblastoma))、小児高悪性度グリオーマ、慢性リンパ性白血病 (CLL (chronic lymphocytic leukemia))、小児肉腫、およびメラノーマを含む8つの腫瘍タイプから得られた、22症例の患者に由来する23の腫瘍検体 (計40のサンプル調製) を解析対象とした。最終的に、合計 216,490 個の単一細胞および単一核のトランスクリプトームデータを取得した。
新鮮組織の解離 (scRNA-Seq用) においては、腫瘍タイプごとの ECM 組成や細胞構成を考慮し、複数の酵素カクテルを比較検証した。NSCLCでは、collagenase 4 (NSCLC-C4) プロトコル、pronase/dispase/elastase/collagenase Aおよび4を混合した PDEC (pronase, dispase, elastase, and collagenases A and 4) プロトコル、および Liberase TM と elastase を混合した LE (Liberase TM and elastase) プロトコルを比較した。MBCでは Liberase TM と DNase I を混合した LD (Liberase TM and DNase I) プロトコル、GBMでは papain を用いたプロトコル、神経芽腫では papain kit を用いたプロトコルを検証した。また、一部の新鮮サンプル (NSCLCおよび卵巣がん腹水) に対しては、MACS (magnetic-activated cell sorting) 用の anti-CD45 MicroBeads を用いて、CD45陽性の免疫細胞を除去 (depletion) し、悪性細胞および間質細胞の濃縮を試みた。
凍結組織からの核単離 (snRNA-Seq用) においては、4つの異なるプロトコルを比較評価した。これらは、界面活性剤ベースの市販バッファーである EZPrep (EZ lysis buffer prep)、NST (Nonidet P40 with salts and Tris)、CST (CHAPS with salts and Tris)、および TST (Tween with salts and Tris) である。
単一細胞および単一核の懸濁液は、10x Genomics Chromium Single Cell 3’ Library (V2またはV3 chemistry) を用いてドロップレットに封入し、ライブラリを調製した。シーケンシングは Illumina HiSeq X または NextSeq を用いて実施した。
データ解析には、クラウドベースの解析フレームワークである Cumulus を使用し、Cell Ranger (v2.0またはv3.0) を用いてデマルチプレクスおよびアライメントを行った。snRNA-Seqデータについては、イントロン領域へのマッピングもカウントに含める「pre-mRNA」参照ゲノム (GRCh38) を構築して適用した。品質管理 (QC (quality control)) として、EmptyDrops アルゴリズムによるアンビエント (環境) RNAのみを含む空ドロップレットの検出、Scrublet によるダブレット (doublet) の予測、および SoupX によるアンビエントRNA汚染率の推定を行った。細胞型の同定には、SingleR による自動アノテーションおよび既知のマーカー遺伝子セットである Aran et al. NatImmunol 2019 を用いた。悪性細胞の同定およびコピー数異常 (CNA (copy number aberration)) の検出には、正常細胞 (免疫細胞や内皮細胞) を対照群とした inferCNV パイプラインを適用した。新鮮サンプルと凍結サンプルの比較解析においては、Seurat (v2.3.4) に実装されている CCA (canonical correlation analysis) である Butler et al. NatBiotechnol 2018 を用いてバッチ効果の補正と共同埋め込み (co-embedding) を行った。
統計学的比較には、2群間の遺伝子数や UMI (unique molecular identifier) 数の差異を評価するために、ノンパラメトリック検定である Mann-Whitney U 検定 (Mann-Whitney) を適用した。また、細胞株や動物モデルの検証として、神経芽腫の検証には、Charles River Laboratories から購入した athymic nude female mice (strain code 553) を用いた O-PDX モデル (O-PDX1) を使用した。