Lineage tracing (系譜追跡)
一行要約
Lineage tracing は単一細胞由来の子孫細胞群 (clone) を固有の 遺伝的 barcode / fluorescent reporter / 累積 DNA scar で追跡する手法群の総称。腫瘍生物学においては cell-of-origin 同定・clonal dominance dynamics・DTP state の時系列追跡・Lineage-plasticity の in vivo 観察・metastatic dissemination 経路の解明 に不可欠であり、近年は CRISPR-based scratchpad 系 (GESTALT / scGESTALT / CARLIN) + scRNA-seq 統合 により単一細胞解像度で「系譜 × 転写状態 × 空間位置」の同時再構築が可能になっている。肺癌領域では KP model での metastasis clonal origin (Quinn et al. Science 2021)、EGFR-TKI 耐性 clone の事前存在検証 (Bhang et al. NatMed 2015)、HPCS の clonal architecture 解明 (Chan et al. Nature 2026) 等の landmark studies が lineage tracing を用いて遂行されている。
原理
1. 古典的手法 (Fluorescent reporter-based)
Cre-lox reporter system
原理: Tissue-specific / inducible Cre recombinase が loxP 配列に flanked された STOP cassette を切除 → downstream の fluorescent protein (GFP / tdTomato / YFP) が irreversibly activated。全子孫細胞が同一 reporter を永続的に発現。
代表的構成:
- SPC-CreERT2 + R26R-LSL-tdTomato: tamoxifen 誘導で AT2 細胞を label → 肺腺癌 cell-of-origin 追跡
- CGRP-CreERT2 + reporter: NE cell lineage label → SCLC 起源細胞研究
- K14-CreERT2 + reporter: basal cell → 扁平上皮癌起源
利点: 長期 in vivo 追跡 / GEMM との seamless integration / lineage-committed population の明確な定義 限界: 単一色 → clone 区別不可 (labeled population 全体を一塊として扱う) / tamoxifen 漏出 (leaky Cre) / Cre toxicity
Confetti / R26R-Confetti system
原理: R26 locus に 4 色 fluorescent cassette (nGFP / YFP / RFP / mCFP) を head-to-tail に挿入。Cre recombination が stochastic にいずれか 1 色を activate → 隣接細胞が異なる色を発現 → clone 別 visualization。
肺癌応用例:
- KP model + R26R-Confetti で primary tumor の clonal architecture を可視化 → monoclonal vs polyclonal tumor initiation の議論
- 腸管 stem cell の clonal drift (Snippert Cell 2010) が founding methodology
限界: 色数限定 (実質 4-10 clone の区別が上限) → 大規模 clonal analysis には不適。蛍光強度差 / spectral overlap で識別困難な場合あり。
Rainbow / Brainbow system
Confetti の variant。3-4 fluorescent protein の stochastic combination で理論上 約90 色を生成。Neural circuit mapping で発展 (Livet Nature 2007)、がん分野では intestinal crypt dynamics に主に使用。
2. DNA barcode-based 手法 (高解像度 clonal tracking)
Lentiviral DNA barcoding
原理: 高多様性 barcode library (10^5-10^7 unique sequences) を lentiviral vector で target cell population に single MOI (multiplicity of infection 約0.3-0.5) で transduction → 各細胞に 1 つの unique barcode が genomic integration → barcode の amplicon sequencing で clone identity を readout。
代表 platform:
| Platform | 特徴 | 代表研究 |
|---|---|---|
| ClonTracer | 30 bp random barcode, high complexity | Bhang et al. NatMed 2015: EGFR-TKI 耐性 clone の pre-existence 実証 |
| CellTag | Combinatorial indexing (sequential tagging) | In vivo sequential labeling → time-resolved lineage tree |
| LARRY | Lentiviral barcode + GFP | Weinreb Cell 2020: hematopoiesis の clonal fate bias |
| ClonMapper | Barcode + expressed reporter | Clone tracking + functional selection |
| Watermelon | Barcode + GFP + scRNA-seq compatible | Clone identity + transcriptome 同時取得 |
EGFR-TKI 耐性の pre-existence 検証: Bhang et al. NatMed 2015 は EGFR-mutant cell line に ClonTracer barcode を導入し erlotinib / gefitinib 処理: 耐性 clone の大多数が治療前から pre-exist (同一 barcode が独立 replicate 間で reproducible に emerge) することを demonstration。ただし一部の耐性は de novo に出現 → pre-existence と de novo acquisition が共存 する model を確立し、Hata et al. NatMed 2016 の 2-path evolutionary model を支持。
Expressed barcode + scRNA-seq integration
Watermelon / LARRY / CellTag 等は barcode を mRNA として発現させ、scRNA-seq で capture → 同一 droplet で clone identity (barcode) + transcriptome (gene expression) を同時に取得。
この統合により:
- DTP state の transcriptomic signature を clone-resolved に定義
- 同一 clone 由来の子孫が heterogeneous な転写状態に分岐するか (stochastic) vs 均一か (deterministic) を検証
- IO response / non-response を clone level で予測
3. CRISPR-based lineage recording (in vivo DNA scratchpad)
基本原理
Cas9 + self-targeting sgRNA array が target sequence を反復切断 → NHEJ repair で 累積的 indel scar が蓄積。Scar pattern が “molecular barcode” として機能し、分岐時点の情報を DNA に encode する (早い分岐の scar は全子孫に共有 → phylogenetic tree reconstruction が可能)。
主要 platform
| Platform | 特徴 | 時間情報 | Single-cell 統合 |
|---|---|---|---|
| GESTALT (Genome Editing of Synthetic Target Arrays for Lineage Tracing) | 10 target site array, zebrafish whole-organism | あり (cumulative scar) | No (bulk readout) |
| scGESTALT | GESTALT + inducible 2nd-wave editing + scRNA-seq | あり + 多段階 | Yes |
| ScarTrace | CRISPR scar + scRNA-seq (zebrafish) | あり | Yes |
| CARLIN (CRISPR Array Repair LINeage tracing) | 10-target inducible array, mouse | あり (dox-inducible) | Yes |
| MEMOIR (Memory by Engineered Mutagenesis with Optical In situ Readout) | FISH-based in situ readout | あり | Spatial context preserved |
| MARC1 (Mouse for Actively Recording Cells) | Homing guide RNA, self-renewing barcode | Extended time window | Yes |
| intMEMOIR | Integrase-based binary recording | Digital (flip/no-flip) | Spatial (smFISH) |
Chan et al. Nature 2019 — CRISPR lineage recording の mammalian paradigm
Chan et al. Nature 2019 は CRISPR lineage tracing を mouse embryogenesis に適用し、全身の細胞系譜を molecular recording で再構築。これにより CRISPR lineage tracing が mammalian system (腫瘍含む) に適用可能であることが実証された paradigm paper。
CARLIN — inducible mouse lineage tracing
CARLIN (Bowling Science 2020) は doxycycline-inducible Cas9 + 10-target array を germline に持つ mouse。任意の時点で dox 投与 → editing burst → その時点以降の全子孫に scar が共有される。Cancer research では: (1) 腫瘍 initiation 時の founder clone 数の定量、(2) treatment 前後の clonal dynamics のリアルタイム記録、(3) metastasis seeding の timing 推定 に応用。
4. Spatial lineage tracing
原理
Lineage barcode + spatial transcriptomics (MERFISH / Slide-seq / Stereo-seq) の統合により、clone identity + 転写状態 + 組織内の物理的位置 を同時に取得。
がん応用の意義:
- Metastatic clone の primary tumor 内での spatial distribution → 「metastasis-competent clone は特定の niche に集中するか」
- Treatment-resistant clone の spatial relationship to vasculature / immune cell
- Cardoso et al. Nature 2026 が示した fibrotic niche 内での腫瘍 initiation clone の spatial enrichment
intMEMOIR と slide-based readout
intMEMOIR (Chow Science 2021) は integrase-based binary recording (各 target site が flip / no-flip) + smFISH in situ readout で、固定組織切片上で lineage + spatial information を同時取得。Tumor 組織への応用で「clone boundary と TME boundary の overlap」を解析可能。
主要エビデンス (がん領域での貢献)
腫瘍 cell-of-origin の同定
Cre-lox lineage tracing は「どの正常細胞型が driver mutation 導入で腫瘍を発生するか」を definitive に同定する:
- NSCLC adenocarcinoma: AT2 cell が KrasG12D / EGFR-L858R で adenocarcinoma を発生 (SPC-CreERT2 lineage tracing で証明)。Club cell は同一 driver で bronchiolar papillary tumor を発生 → 起源細胞が histology を規定
- SCLC: NE cell (CGRP+) が Rb1/Trp53 deletion で SCLC を発生 (Sutherland Cell 2011)。POU2F3+ tuft cell 起源の SCLC-P subtype も lineage tracing で示唆
- Squamous cell carcinoma: Basal cell (K14+) 起源。SOX2 amplification / PIK3CA mutation で initiate
- Sun et al. DevCell 2022 が lung cell type の comprehensive census を提供し、lineage tracing target の reference atlas として機能
Clonal dynamics と drug resistance
Pre-existing vs de novo resistance
Bhang et al. NatMed 2015 の ClonTracer 実験は EGFR-TKI resistance field の conceptual foundation:
- 約10^5 barcoded cells に erlotinib 処理 → 耐性 colony の barcode を replicate 間比較
- >50% の耐性 barcode が independent replicate 間で shared → pre-existing resistant clone
- 残り <50% は replicate-unique → de novo emergence (DTP 経由)
- この定量的分離は Hata et al. NatMed 2016 の 2-path model (pre-existing selection + DTP → de novo acquisition) を direct に support
DTP state の clonal architecture
Watermelon / LARRY 等の expressed barcode + scRNA-seq は DTP state の本質を clone-resolved に解明:
- DTP 状態に入る clone は 治療前から特定の transcriptomic signature (chromatin remodeling / fatty acid oxidation / mesenchymal gene) を持つか → partially pre-determined
- DTP → resistant clone への transition は all DTP clone で均等か、特定 clone のみか → stochastic + selective model
- Marine et al. NatRevCancer 2020 が non-genetic resistance mechanism と lineage tracing の統合を review
Fennell et al. Nature 2022
Fennell et al. Nature 2022 は lentiviral barcode + scRNA-seq で non-genetic determinants of clonal fitness を single-cell resolution で同定。Genetic mutation なしに clone 間で fitness 差が存在し、epigenetic / transcriptomic state が clonal dominance を規定する — lineage tracing なしには観察不可能な現象。
Metastasis dissemination の clonal 解析
Quinn et al. Science 2021
Quinn et al. Science 2021 は高複雑度 DNA barcoding + multi-organ harvest で cancer xenograft の metastasis を clone-resolved に追跡:
- Polyclonal seeding が dominant pattern: 単一転移巣に複数 barcode clone が co-localize → collective migration / polyclonal colonization
- Metastatic fitness は proliferative fitness と非等価: Primary tumor で dominant な clone が必ずしも metastasis で dominant ではない
- 臓器特異性: 特定の clone が特定の臓器に preferential にseed → organ tropism の clone-intrinsic basis
この結果は TRACERx の monoclonal seeding dominant (Hessey et al. Nature 2026) と表面上 contrast するが、model system (xenograft vs autochthonous human) と analysis resolution の違いを反映。
KP model metastasis tracing
KP GEMM + Confetti / lentiviral barcode で肺原発巣 → lymph node → distant metastasis の clonal relationship を追跡。Monoclonal vs polyclonal seeding の議論に in vivo autochthonous model での evidence を提供。
Lineage plasticity の in vivo 追跡
Chan et al. Nature 2026
Chan et al. Nature 2026 は KP model + lineage tracing (Confetti / barcode) で high-plasticity cell state (HPCS) の clonal architecture を解明:
- HPCS は特定の clone に由来するのではなく、多数の独立 clone から parallel に出現
- HPCS clone は adenocarcinoma → squamous / mesenchymal / NE 等の multiple lineage に分岐可能
- Lineage tracing なしには HPCS の polyclonal origin と multi-lineage potential を区別できない
Yum et al. Nature 2021
Yum et al. Nature 2021 は Cre-lox lineage tracing で oncogene-driven stem cell niche remodeling を追跡。Oncogene activation が cell-autonomous の増殖だけでなく、隣接正常 stem cell の displacement を誘導する non-cell-autonomous mechanism を lineage tracing で可視化。
Cancer dormancy と再活性化
- Dormant disseminated tumor cell (DTC) の lineage tracing: barcode label → dormancy period → reactivation 後の clone identity 確認 → 「目覚めた」clone が original primary clone と同一か / dormancy 中に分子変化したか
- Wan et al. NatCellBiol 2026 は Thy1+ cancer stem cell が metastasis を drive する経路を lineage tracing で追跡
Stem cell hierarchy mapping
- 正常肺の AT2 stem cell / club cell progenitor hierarchy を lineage tracing で定義
- Cancer stem cell (CSC) 仮説の検証: barcoding で CSC clone の self-renewal vs differentiation の asymmetry を定量
- Batlle et al. NatMed 2017 が cancer stem cell の revisited framework を提供
限界と注意点
技術的限界
| 限界 | 影響 | 対処法 |
|---|---|---|
| Barcode 多様性不足 | Low-complexity library → 同一 barcode 重複 (collision) → false clone merging | Library complexity > 10x cell number を確保。Collision rate を computational に推定 |
| MOI 制御 | High MOI → 1 細胞に複数 barcode → 解析複雑化。Low MOI → labeling efficiency 低下 | MOI 0.3-0.5 で single integration を target |
| scRNA-seq barcode capture | Barcode 検出率 < 100% (3’ capture の場合 barcode が 5’ に位置すると drop) | Barcode を 3’ UTR に配置 / dedicated barcode amplicon library |
| CRISPR scratchpad indel saturation | Long-term tracing で target site が full saturation → 新規 scar 蓄積不可 → 時間情報喪失 | Multi-target array / inducible design (CARLIN) / self-targeting homing guide (MARC1) |
| In vivo delivery 効率 | Viral barcode を autochthonous tumor に均一導入困難 | GEMM に germline barcode system を組み込む / 初期 initiation 段階で label |
| Epigenetic silencing | Reporter / barcode の promoter methylation → signal loss over time | CMV → EF1α / CAG promoter で silencing 耐性向上 |
| Bottleneck artifact | 移植 / 治療による bottleneck → 少数 clone が非生物学的に enriched | Pre-treatment barcode sampling で baseline diversity を記録 |
解析的 pitfall
- Survivor bias: 治療後に回収される barcode は survivor のみ → 「消えた clone」の情報は lost。治療前 sampling で full diversity を capture し、消失 clone を inference
- Clone size vs fitness: 大きい clone = fit とは限らない。Stochastic drift (neutral evolution) で size 差が生じる → Williams et al. NatGenet 2016 の neutral evolution test と組み合わせ
- Temporal resolution の限界: Lentiviral barcode は static (一度のラベル) → 中間時点の branching を reconstruction 不可。CRISPR scratchpad は累積 scar で中間 history を encode するが resolution は scar rate に依存
- Spatial sampling bias: 組織の一部のみ解析 → rare clone / spatially restricted clone を miss。Whole-organ digestion + bulk barcode で coverage 確保
- Cross-contamination: barcode PCR amplification 中の index hopping / cross-contamination → false clone sharing between samples。Unique dual index + stringent filtering
生物学的考慮事項
- Label timing と interpretability: 「いつ label したか」が結果の解釈を決定する。Tumor initiation 前 label → cell-of-origin。Established tumor label → clonal dynamics。Treatment 前 label → resistance clone pre-existence
- Clone ≠ Cell type: 同一 clone 内の細胞が heterogeneous な表現型を持ちうる (non-genetic diversity) → clone identity と cell state を独立した axis として扱う
- Barcode → fitness inference の non-triviality: Clone size は fitness + neutral drift + stochastic extinction の composite → mathematical modeling (birth-death process) で fitness estimation
Open Questions
- 時間 + 系譜 + 状態 + 空間の四重統合: CRISPR scratchpad (系譜 + 時間) + scRNA-seq (転写状態) + spatial transcriptomics (空間) + live imaging (動態) の full integration。Computational challenge (tree reconstruction + spatial embedding + state mapping の joint inference) が major bottleneck
- Clinical 応用 — 患者 sample への翻訳: Naturally occurring somatic mutation (SNV / CNV / mtDNA mutation) を “endogenous barcode” として患者腫瘍の clonal architecture を reconstruct。ctDNA-based clonal tracking は Clonal-evolution-ITH / TRACERx で先行
- DTP / 耐性 clone の治療前予測: Barcode + scRNA-seq で定義された DTP transcriptomic signature を、biopsy sample で barcode なしに detection → patient stratification biomarker への translation
- Lineage plasticity の reversibility: 一度 plastic 状態 (HPCS / mesenchymal / NE) に移行した clone の re-differentiation potential。「不可逆転換 vs 可逆状態」を lineage tracing で temporal resolution を持って追跡
- Metastatic seeding pattern の disease / model 依存性: Polyclonal (Quinn et al. Science 2021 xenograft) vs monoclonal (TRACERx human) の discrepancy resolution。Model system の impact vs genuine biology の区別
- In vivo CRISPR lineage recording の長期安定性: CARLIN / MARC1 の scar saturation 問題。Self-renewing barcode / prime editing-based recording の次世代 platform development
- Immune-tumor co-evolution の clone-resolved 追跡: Tumor barcode + TCR-seq 同時取得 → 特定 tumor clone を認識する T cell clone の temporal dynamics
- Dormancy reactivation の trigger 同定: Dormant DTC の lineage tracing + perturbation screen → 覚醒 trigger の systematic identification
重要論文 Top 10
- ★★★★★ Bhang et al. NatMed 2015 — ClonTracer — EGFR-TKI 耐性 clone pre-existence 実証、cancer barcode tracing の founding methodology
- ★★★★★ Quinn et al. Science 2021 — Barcode metastasis tracing — polyclonal seeding / organ tropism / metastatic fitness の quantitative framework
- ★★★★★ Chan et al. Nature 2026 — KP lineage tracing で HPCS の polyclonal origin + multi-lineage potential を実証
- ★★★★★ Chan et al. Nature 2019 — CRISPR lineage recording の mammalian paradigm — 全身系譜再構築
- ★★★★ Fennell et al. Nature 2022 — Non-genetic clonal fitness — barcode + scRNA-seq で epigenetic fitness を定量
関連エンティティ・概念
- 関連手法: scRNA-seq (転写状態の同時取得) / CRISPR-screen (perturbation + lineage の統合) / GEMM (in vivo lineage tracing の primary platform) / Spatial-transcriptomics (空間 lineage 情報) / Organoid (in vitro clonal expansion + barcode tracking)
- 解明される現象: Drug-tolerant-persister (DTP clone の pre-existence / emergence dynamics) / Lineage-plasticity (multi-lineage potential の clone-resolved 追跡) / Clonal-evolution-ITH (clonal architecture + evolution の直接観察) / Cancer-dormancy (dormant DTC の reactivation lineage) / Pre-metastatic-niche (metastatic clone の spatial origin)
- 対象 driver: EGFR (TKI 耐性 clone tracing) / KRAS (KP model metastasis) / TP53 / ASCL1 / NEUROD1 / POU2F3
- MOC: cancer-biology / lung-cancer-biology