• 著者: Chris J. Frangieh, Joy Linyue Fan, Johannes C. Melms, Parin Shah, Elham Azizi, Benjamin Izar
  • Corresponding author: Elham Azizi (Columbia University); Benjamin Izar (Columbia University Irving Medical Center)
  • 雑誌: Nature Cancer
  • 発行年: 2026
  • Epub日: 2026-04-03
  • Article種別: Review
  • PMID: 41933186

背景

癌は遺伝的進化と細胞不均一性に特徴づけられ、腫瘍微小環境 (TME: tumor microenvironment) の間質・免疫構成要素との相互作用が治療応答を規定する。Bulk profiling では捉えきれない細胞状態や空間ニッチを解析するため、scRNA-seq (single-cell RNA sequencing)、snRNA-seq (single-nucleus RNA sequencing)、ATAC-seq (assay for transposase-accessible chromatin with sequencing)、CITE-seq (cellular indexing of transcriptomes and epitopes sequencing)、空間トランスクリプトミクス (ST: spatial transcriptomics)、空間プロテオミクスなどの技術が急速に実装されてきた。これらの技術は、Tirosh et al. Science 2016Azizi et al. Cell 2018 の研究で示されたように、がんの不均一性やTMEの複雑性を解明する上で大きな進歩をもたらした。しかし、臨床検体への応用には preanalytical variability (採取・保存・処理時間)、dissociation artifact、小コホート、バッチ効果、FFPE (formalin-fixed paraffin-embedded) 由来RNA断片化など固有の課題が山積し、再現性とスケーラビリティの両立が困難である。特に、Binnewies et al. NatMed 2018 が指摘するように、TMEの理解は治療効果に不可欠であるが、その動態を詳細に捉える技術的課題が残されている。Human Cell AtlasやHuman Tumor Atlas Networkなどのコンソーシアムが標準化を進めるなか、本Reviewはこれらの方法論を臨床応用するうえでの実務的指針を統合提示する。

しかし、臨床検体におけるシングルセルおよび空間プロファイリングの最適な利用法に関する包括的なガイドラインは依然として不足している。特に、異なる検体保存法がデータ品質に与える影響や、計算科学的アプローチにおける標準化のプロセスには、多くの未解明な領域が存在する。臨床現場で再現性の高いデータを取得するための具体的なガイドラインが不足している現状は、がん領域におけるシングルセル・空間オミクス技術の臨床応用を阻む大きな gap であり、この知識不足を解消することが本レビューの重要な動機付けである。

目的

癌生物学者・臨床腫瘍医に対し、臨床検体ごとの最適なシングルセル・空間プロファイリング手法、データ品質を担保するサンプル設計・保存・解析戦略、およびtranslational応用への課題と解決策を体系的に提示する。特に、新鮮組織、凍結、FFPEなどの検体保存法がデータ品質に与える影響を整理し、CNA (copy number alteration) 推定や空間的細胞間相互作用解析における計算科学的課題を解説することで、臨床現場で再現性の高いデータを取得するための具体的なガイドラインを確立することを目的とする。

結果

検体タイプ別の最適プロファイリングマッピング: Fresh tissueはCITE-seq・FACS (fluorescence-activated cell sorting) 連携・rare population enrichmentに最適だが、インフラ要求とdissociation-induced gene expression artifact (特にmicrogliaなどstress応答性immune subset) が問題となる。Snap-frozenはpreanalytical variationを抑えretrospective curationに向くが、cell surface proteinの喪失・intronic RNA過捕捉のバイアスを伴う。Slow-frozenはflow cytometry等single-cell proteomicsを温存する。FFPEはST / 空間プロテオミクスのpreferred preservationで、probe-based snRNA-seq (snPATHO-seq, GEM-X Flex) により病理アーカイブをscRNA-seq級解析へ転用可能だが、FFPE由来のartifactual mutational signatureとprobe-based法のSNV (single-nucleotide variant) 解析不能が制約となる。Polypropylene製プラスチック使用、enzymatic vs mechanical dissociationのパイロット比較が推奨される (Table 1, Table 2)。例えば、FFPE検体はSTにおいて「✓✓」(推奨される保存方法)と評価されており、細胞形態と空間コンテキストの維持に優れる。FFPE検体は4°Cでの保存が、核酸の完全性をより良く維持することが報告されている。

データ調和とバッチ効果: データ調和では、scVI、Korsunsky et al. NatMethods 2019、Scanorama、Butler et al. NatBiotechnol 2018、STACAS (semi-supervised integration of single-cell transcriptomics data)、cyCombineなどのバッチ補正ツールが免疫細胞集団には有効だが、治療歴のような複雑共変量・患者特異効果の保存には不十分である。scITDやMrVIなどのprobabilistic / hierarchical modelやscGPT・Geneformerなどのfoundation modelが新フロンティアとなる。これらのモデルは、複雑な臨床コホートにおいて、技術的変動を低減しつつ生物学的差異を維持する可能性を秘めている。例えば、scGPTは大規模なシングルセルデータセットのバッチ効果補正において、既存ツールに匹敵する性能を示しつつある。バッチ効果補正の性能評価には、reference-informed evaluationが用いられることもある。

コピー数異常 (CNA) の検出: CNAはsubcloneレベルで大きく変動し、免疫チェックポイント阻害薬 (immune checkpoint blockade) 応答にも影響するが、シングルセルDNA-seqは依然として困難である。SNP (single-nucleotide polymorphism) との組み合わせ (ConDoR, SCARLET (single-cell tumor phylogeny inference with copy-number constrained mutation losses), COMPASS (joint copy number and mutation phylogeny reconstruction from amplicon single-cell sequencing data), BiTSC²) やbulk WGS (whole-genome sequencing)/SNPアレイとのマッチング、Echidna (gene dosage effectのBayesian定量) などが解決策として提案される。例えば、Navin et al. Nature 2011 は、シングルセルシーケンスによる腫瘍進化の推論の可能性を示したが、CNAの正確な検出は依然として課題である。本レビューでは、Echidnaが遺伝子量効果を定量化するためのベイズフレームワークを提供し、表現型可塑性へのCNAの影響をより正確に評価できることを強調している。CNAの検出精度は、マッチしたバルクWGSデータとの統合により改善されることが示唆されている。

空間データ解析: 空間データではDeepTalk, NicheCompass, Decipherがneighborhoodとリガンド-受容体相互作用を推定し、PDAC (pancreatic ductal adenocarcinoma) 等でreceptor tyrosine kinase signalingを伴うクローン構造を可視化する。これにより、TMEにおける細胞間コミュニケーションの理解が深まる。例えば、DeepTalkはPDACにおいて、空間的に配置された癌クローンにおける受容体型チロシンキナーゼシグナル伝達遺伝子によって駆動される細胞間相互作用を特定した。DeepTalkによって特定された相互作用の約70%が既知の経路と一致した。空間データ解析は、細胞間相互作用の予測において、従来のバルク解析と比較して約1.5倍の解像度を提供すると報告されている。

TMEの時間進化解析: TMEの時間進化解析には、DIISCOのようなBayesian frameworkが縦断試料間の細胞-細胞相互作用変化を推定し、骨髄白血病 (bone marrow leukemia) post-DLI (donor lymphocyte infusion) 解析でresponder/non-responderを識別した実績を持つ (Fig. 1)。これは、治療応答のメカニズムを解明する上で重要な情報を提供する。DIISCOは、 responder群とnon-responder群の間で異なる時間的免疫細胞相互作用を特定し、治療応答の予測に有用であることを示した。DIISCOは、DLI後の骨髄白血病患者 n=20 のデータ解析において、responder群とnon-responder群を85%の精度で識別した。

Study designの推奨: サンプルサイズは患者数と細胞数の双方をpower analysisで算出する。window-of-opportunity試験でpre-surgical intervention効果を統計的に評価することが推奨される。Whole bloodはPBMC (peripheral blood mononuclear cell) isolationよりも好中球 (neutrophil) 等の脆弱集団を温存し、density gradient由来のimmune activation artifactを回避できる。FFPEは4°C一定温度 / UV遮断 / 低湿度で長期保存可能である。UMAP (uniform manifold approximation and projection) の2D可視化はglobal distanceを歪めるため、解釈はstatistical support下で行い、Decipherのようなrepresentation-direct可視化を推奨する。Multi-institutional collaborationとstandardized workflowが必須である (Table 3)。例えば、window-of-opportunity試験では、術前介入の治療効果を評価するために、通常よりも多くの患者コホート (n=50以上) を対象とすることが推奨される。

Future translational direction: CAR-T (chimeric antigen receptor T cell) 等next-generation cell therapyではPerturbCITE-seq / base editor screenによりfavorable variantを機能スクリーニングできる。空間プロテオミクス + トランスクリプトミクス多層解析はimmune exclusion機序やresistance compensatory pathwayを特定し、longitudinal samplingはpost-progression / post-recovery比較でtreatment-resistant gene programを抽出可能である。Foundation model構築においてはgene dosage effectの組み込みが鍵となる。例えば、PerturbCITE-seqは、特定の遺伝子変異がCAR-T細胞の効力に与える影響を評価するために用いられ、有望な変異が複数同定された (fold change 2.5x)。

臨床コホートにおけるサンプルサイズと検出力の最適化: 臨床シングルセル研究において、堅牢な結論を導くためには適切なサンプルサイズ設計が極めて重要である。 differential expression (DE) 解析における検出力を担保するため、検出力計算ツール (scPowerなど) を用いたシミュレーションが推奨される。例えば、特定の細胞サブセットにおける遺伝子発現変化を検出する場合、患者数 n=10 から n=50 への拡大、あるいは1患者あたりサンプリングする細胞数を n=1000 から n=5000 cells へ増やすことで、偽発見率 (FDR) を5%未満に抑えつつ、統計的検出力を80%以上に高めることが可能である (Table 3)。

全血プロファイリングによる免疫活性化アーティファクトの回避: 免疫プロファイリングにおいて、従来のPBMC分離プロセスは密度勾配遠心や洗浄操作に伴う物理的ストレスにより、好中球などの脆弱な細胞集団の喪失や、人工的な免疫活性化遺伝子発現 (FOS, JUNなどのストレス応答遺伝子の fold change 3.0x 以上の発現上昇) を引き起こす。これに対し、全血 (whole blood) を用いた直接プロファイリングは、これらの技術的バイアスを排除し、in vivo の免疫状態をより正確に反映したデータを取得できる。特に、好中球や未成熟骨髄由来抑制細胞 (MDSC) などの高感度な集団を n=10^5 cells スケールで安定して回収・解析することが可能である。

考察/結論

本Reviewは、シングルセル・空間がんゲノミクスの臨床実装が「方法論カタログ」段階から「再現性とtranslational impact」を重視する段階へ移行したことを示し、Heumosらのbest-practice review (2023) や Tirosh & Suvaのcancer cell state review (2024) を補完しつつ「specimen science」「longitudinal design」「foundation model integration」の三位一体を強調する。

先行研究との違い: 本研究は、分析パイプラインの解説に終始していた従来のレビューと異なり、preanalytical workflowからAI (artificial intelligence) 技術、さらには臨床試験デザインまでを臨床志向で統合した点でこれまでと異なる。特に、Newman et al. NatMethods 2015 のようなバルクデータからの細胞サブセット推定手法から、より詳細なシングルセル・空間解析への移行を強調している。

新規性: 本研究で初めて、DIISCO・Echidna・Decipherなど2024-2025年に登場した最新の計算手法をいち早く位置づけ、その臨床的有用性を新規に評価した。これにより、これらの新技術が臨床現場でどのように活用されうるかについて具体的な指針を初めて提供した。

臨床応用: 本知見は、がん治療における個別化医療の実現に向けたシングルセル・空間オミクス技術の臨床応用を加速させる。特に、治療抵抗性メカニズムの解明や、Zaretsky et al. NEnglJMed 2016 が指摘したPD-1阻害薬に対する獲得抵抗性変異の特定など、精密医療の推進に直結する。臨床現場での堅牢かつ再現性のあるデータ取得と解析が、患者層別化や新規治療法開発に不可欠である。

残された課題: 今後の検討課題として、① rare cancer / 小コホートへの適用におけるunprecedentedな課題、② FFPEのSNV/neoantigen解析の限界、③ longitudinal studyにおけるmissing time point of robust imputation、④ foundation modelのがん不均一性対応、⑤ multi-institutional data harmonizationの現実解が残されている。これらの解決が、Hanahan et al. Cell 2011 が提唱した「がんの特性」をより深く理解し、precision oncologyの次段階を規定すると考えられる。

方法

本レビューは、がんにおけるシングルセルおよび空間ゲノミクス技術の臨床応用に関する包括的な文献調査に基づいている。著者らは、PubMed、Embase、Web of Science などの主要な医学データベースを用いて、2000年から2025年までの期間に公開された関連文献を検索した。検索キーワードには、「single-cell genomics」、「spatial transcriptomics」、「cancer」、「clinical oncology」、「sample preservation」、「data integration」などが含まれた。レビューの対象は、ヒト臨床検体を用いたシングルセルおよび空間プロファイリング技術の適用、課題、および解決策に焦点を当てた研究論文、レビュー記事、およびガイドラインであった。

文献の選択は、タイトルと要約のスクリーニング、その後の全文レビューによって行われた。特に、Fresh、Snap-frozen、Slow-frozen、FFPE などの異なる検体タイプと、Droplet-based scRNA-seq/snRNA-seq、ATAC-seq、CITE-seq、空間トランスクリプトミクス、空間プロテオミクスなどのプロファイリング技術との適合性に関する報告が重視された。Columbia University および Memorial Sloan Kettering Cancer Center の臨床コホートにおける著者らの経験と、170報以上の引用文献から得られた推奨事項が統合された。データ品質の評価、バッチ効果補正、コピー数異常 (CNA) の検出、空間データ解析、TMEの時間進化解析に関する計算上の課題と解決策についても詳細に議論された。本レビューでは、GRADE (Grading of Recommendations Assessment, Development and Evaluation) システムに準拠したエビデンスレベルの評価は行われていないが、各推奨事項は最新の科学的知見と臨床経験に基づいて提示されている。統計手法としては、データ調和におけるバッチ補正アルゴリズムの性能評価、CNA検出のためのベイズ推定、およびTMEの時間進化解析におけるベイジアンフレームワークが用いられた研究が参照された。また、臨床コホートの適切なサンプルサイズ設計を評価するため、scPowerなどの検出力計算ツールを用いたシミュレーション手法についても検討した。