Lineage tracing (系譜追跡)

一行要約

Lineage tracing は単一細胞由来の子孫細胞群 (clone) を固有の 遺伝的 barcode / fluorescent reporter / 累積 DNA scar で追跡する手法群の総称。腫瘍生物学においては cell-of-origin 同定・clonal dominance dynamics・DTP state の時系列追跡・Lineage-plasticity の in vivo 観察・metastatic dissemination 経路の解明 に不可欠であり、近年は CRISPR-based scratchpad 系 (GESTALT / scGESTALT / CARLIN) + scRNA-seq 統合 により単一細胞解像度で「系譜 × 転写状態 × 空間位置」の同時再構築が可能になっている。肺癌領域では KP model での metastasis clonal origin (Quinn et al. Science 2021)、EGFR-TKI 耐性 clone の事前存在検証 (Bhang et al. NatMed 2015)、HPCS の clonal architecture 解明 (Chan et al. Nature 2026) 等の landmark studies が lineage tracing を用いて遂行されている。

原理

1. 古典的手法 (Fluorescent reporter-based)

Cre-lox reporter system

原理: Tissue-specific / inducible Cre recombinase が loxP 配列に flanked された STOP cassette を切除 → downstream の fluorescent protein (GFP / tdTomato / YFP) が irreversibly activated。全子孫細胞が同一 reporter を永続的に発現。

代表的構成:

  • SPC-CreERT2 + R26R-LSL-tdTomato: tamoxifen 誘導で AT2 細胞を label → 肺腺癌 cell-of-origin 追跡
  • CGRP-CreERT2 + reporter: NE cell lineage label → SCLC 起源細胞研究
  • K14-CreERT2 + reporter: basal cell → 扁平上皮癌起源

利点: 長期 in vivo 追跡 / GEMM との seamless integration / lineage-committed population の明確な定義 限界: 単一色 → clone 区別不可 (labeled population 全体を一塊として扱う) / tamoxifen 漏出 (leaky Cre) / Cre toxicity

Confetti / R26R-Confetti system

原理: R26 locus に 4 色 fluorescent cassette (nGFP / YFP / RFP / mCFP) を head-to-tail に挿入。Cre recombination が stochastic にいずれか 1 色を activate → 隣接細胞が異なる色を発現 → clone 別 visualization

肺癌応用例:

  • KP model + R26R-Confetti で primary tumor の clonal architecture を可視化 → monoclonal vs polyclonal tumor initiation の議論
  • 腸管 stem cell の clonal drift (Snippert Cell 2010) が founding methodology

限界: 色数限定 (実質 4-10 clone の区別が上限) → 大規模 clonal analysis には不適。蛍光強度差 / spectral overlap で識別困難な場合あり。

Rainbow / Brainbow system

Confetti の variant。3-4 fluorescent protein の stochastic combination で理論上 約90 色を生成。Neural circuit mapping で発展 (Livet Nature 2007)、がん分野では intestinal crypt dynamics に主に使用。

2. DNA barcode-based 手法 (高解像度 clonal tracking)

Lentiviral DNA barcoding

原理: 高多様性 barcode library (10^5-10^7 unique sequences) を lentiviral vector で target cell population に single MOI (multiplicity of infection 約0.3-0.5) で transduction → 各細胞に 1 つの unique barcode が genomic integration → barcode の amplicon sequencing で clone identity を readout。

代表 platform:

Platform特徴代表研究
ClonTracer30 bp random barcode, high complexityBhang et al. NatMed 2015: EGFR-TKI 耐性 clone の pre-existence 実証
CellTagCombinatorial indexing (sequential tagging)In vivo sequential labeling → time-resolved lineage tree
LARRYLentiviral barcode + GFPWeinreb Cell 2020: hematopoiesis の clonal fate bias
ClonMapperBarcode + expressed reporterClone tracking + functional selection
WatermelonBarcode + GFP + scRNA-seq compatibleClone identity + transcriptome 同時取得

EGFR-TKI 耐性の pre-existence 検証: Bhang et al. NatMed 2015 は EGFR-mutant cell line に ClonTracer barcode を導入し erlotinib / gefitinib 処理: 耐性 clone の大多数が治療前から pre-exist (同一 barcode が独立 replicate 間で reproducible に emerge) することを demonstration。ただし一部の耐性は de novo に出現 → pre-existence と de novo acquisition が共存 する model を確立し、Hata et al. NatMed 2016 の 2-path evolutionary model を支持。

Expressed barcode + scRNA-seq integration

Watermelon / LARRY / CellTag 等は barcode を mRNA として発現させ、scRNA-seq で capture → 同一 droplet で clone identity (barcode) + transcriptome (gene expression) を同時に取得。

この統合により:

  • DTP state の transcriptomic signature を clone-resolved に定義
  • 同一 clone 由来の子孫が heterogeneous な転写状態に分岐するか (stochastic) vs 均一か (deterministic) を検証
  • IO response / non-response を clone level で予測

3. CRISPR-based lineage recording (in vivo DNA scratchpad)

基本原理

Cas9 + self-targeting sgRNA array が target sequence を反復切断 → NHEJ repair で 累積的 indel scar が蓄積。Scar pattern が “molecular barcode” として機能し、分岐時点の情報を DNA に encode する (早い分岐の scar は全子孫に共有 → phylogenetic tree reconstruction が可能)。

主要 platform

Platform特徴時間情報Single-cell 統合
GESTALT (Genome Editing of Synthetic Target Arrays for Lineage Tracing)10 target site array, zebrafish whole-organismあり (cumulative scar)No (bulk readout)
scGESTALTGESTALT + inducible 2nd-wave editing + scRNA-seqあり + 多段階Yes
ScarTraceCRISPR scar + scRNA-seq (zebrafish)ありYes
CARLIN (CRISPR Array Repair LINeage tracing)10-target inducible array, mouseあり (dox-inducible)Yes
MEMOIR (Memory by Engineered Mutagenesis with Optical In situ Readout)FISH-based in situ readoutありSpatial context preserved
MARC1 (Mouse for Actively Recording Cells)Homing guide RNA, self-renewing barcodeExtended time windowYes
intMEMOIRIntegrase-based binary recordingDigital (flip/no-flip)Spatial (smFISH)

Chan et al. Nature 2019 — CRISPR lineage recording の mammalian paradigm

Chan et al. Nature 2019 は CRISPR lineage tracing を mouse embryogenesis に適用し、全身の細胞系譜を molecular recording で再構築。これにより CRISPR lineage tracing が mammalian system (腫瘍含む) に適用可能であることが実証された paradigm paper。

CARLIN — inducible mouse lineage tracing

CARLIN (Bowling Science 2020) は doxycycline-inducible Cas9 + 10-target array を germline に持つ mouse。任意の時点で dox 投与 → editing burst → その時点以降の全子孫に scar が共有される。Cancer research では: (1) 腫瘍 initiation 時の founder clone 数の定量、(2) treatment 前後の clonal dynamics のリアルタイム記録、(3) metastasis seeding の timing 推定 に応用。

4. Spatial lineage tracing

原理

Lineage barcode + spatial transcriptomics (MERFISH / Slide-seq / Stereo-seq) の統合により、clone identity + 転写状態 + 組織内の物理的位置 を同時に取得。

がん応用の意義:

  • Metastatic clone の primary tumor 内での spatial distribution → 「metastasis-competent clone は特定の niche に集中するか」
  • Treatment-resistant clone の spatial relationship to vasculature / immune cell
  • Cardoso et al. Nature 2026 が示した fibrotic niche 内での腫瘍 initiation clone の spatial enrichment

intMEMOIR と slide-based readout

intMEMOIR (Chow Science 2021) は integrase-based binary recording (各 target site が flip / no-flip) + smFISH in situ readout で、固定組織切片上で lineage + spatial information を同時取得。Tumor 組織への応用で「clone boundary と TME boundary の overlap」を解析可能。

主要エビデンス (がん領域での貢献)

腫瘍 cell-of-origin の同定

Cre-lox lineage tracing は「どの正常細胞型が driver mutation 導入で腫瘍を発生するか」を definitive に同定する:

  • NSCLC adenocarcinoma: AT2 cell が KrasG12D / EGFR-L858R で adenocarcinoma を発生 (SPC-CreERT2 lineage tracing で証明)。Club cell は同一 driver で bronchiolar papillary tumor を発生 → 起源細胞が histology を規定
  • SCLC: NE cell (CGRP+) が Rb1/Trp53 deletion で SCLC を発生 (Sutherland Cell 2011)。POU2F3+ tuft cell 起源の SCLC-P subtype も lineage tracing で示唆
  • Squamous cell carcinoma: Basal cell (K14+) 起源。SOX2 amplification / PIK3CA mutation で initiate
  • Sun et al. DevCell 2022 が lung cell type の comprehensive census を提供し、lineage tracing target の reference atlas として機能

Clonal dynamics と drug resistance

Pre-existing vs de novo resistance

Bhang et al. NatMed 2015 の ClonTracer 実験は EGFR-TKI resistance field の conceptual foundation:

  • 約10^5 barcoded cells に erlotinib 処理 → 耐性 colony の barcode を replicate 間比較
  • >50% の耐性 barcode が independent replicate 間で shared → pre-existing resistant clone
  • 残り <50% は replicate-unique → de novo emergence (DTP 経由)
  • この定量的分離は Hata et al. NatMed 2016 の 2-path model (pre-existing selection + DTP → de novo acquisition) を direct に support

DTP state の clonal architecture

Watermelon / LARRY 等の expressed barcode + scRNA-seq は DTP state の本質を clone-resolved に解明:

  • DTP 状態に入る clone は 治療前から特定の transcriptomic signature (chromatin remodeling / fatty acid oxidation / mesenchymal gene) を持つか → partially pre-determined
  • DTP → resistant clone への transition は all DTP clone で均等か、特定 clone のみか → stochastic + selective model
  • Marine et al. NatRevCancer 2020 が non-genetic resistance mechanism と lineage tracing の統合を review

Fennell et al. Nature 2022

Fennell et al. Nature 2022 は lentiviral barcode + scRNA-seq で non-genetic determinants of clonal fitness を single-cell resolution で同定。Genetic mutation なしに clone 間で fitness 差が存在し、epigenetic / transcriptomic state が clonal dominance を規定する — lineage tracing なしには観察不可能な現象。

Metastasis dissemination の clonal 解析

Quinn et al. Science 2021

Quinn et al. Science 2021 は高複雑度 DNA barcoding + multi-organ harvest で cancer xenograft の metastasis を clone-resolved に追跡:

  • Polyclonal seeding が dominant pattern: 単一転移巣に複数 barcode clone が co-localize → collective migration / polyclonal colonization
  • Metastatic fitness は proliferative fitness と非等価: Primary tumor で dominant な clone が必ずしも metastasis で dominant ではない
  • 臓器特異性: 特定の clone が特定の臓器に preferential にseed → organ tropism の clone-intrinsic basis

この結果は TRACERx の monoclonal seeding dominant (Hessey et al. Nature 2026) と表面上 contrast するが、model system (xenograft vs autochthonous human) と analysis resolution の違いを反映。

KP model metastasis tracing

KP GEMM + Confetti / lentiviral barcode で肺原発巣 → lymph node → distant metastasis の clonal relationship を追跡。Monoclonal vs polyclonal seeding の議論に in vivo autochthonous model での evidence を提供。

Lineage plasticity の in vivo 追跡

Chan et al. Nature 2026

Chan et al. Nature 2026 は KP model + lineage tracing (Confetti / barcode) で high-plasticity cell state (HPCS) の clonal architecture を解明:

  • HPCS は特定の clone に由来するのではなく、多数の独立 clone から parallel に出現
  • HPCS clone は adenocarcinoma → squamous / mesenchymal / NE 等の multiple lineage に分岐可能
  • Lineage tracing なしには HPCS の polyclonal origin と multi-lineage potential を区別できない

Yum et al. Nature 2021

Yum et al. Nature 2021 は Cre-lox lineage tracing で oncogene-driven stem cell niche remodeling を追跡。Oncogene activation が cell-autonomous の増殖だけでなく、隣接正常 stem cell の displacement を誘導する non-cell-autonomous mechanism を lineage tracing で可視化。

Cancer dormancy と再活性化

  • Dormant disseminated tumor cell (DTC) の lineage tracing: barcode label → dormancy period → reactivation 後の clone identity 確認 → 「目覚めた」clone が original primary clone と同一か / dormancy 中に分子変化したか
  • Wan et al. NatCellBiol 2026 は Thy1+ cancer stem cell が metastasis を drive する経路を lineage tracing で追跡

Stem cell hierarchy mapping

  • 正常肺の AT2 stem cell / club cell progenitor hierarchy を lineage tracing で定義
  • Cancer stem cell (CSC) 仮説の検証: barcoding で CSC clone の self-renewal vs differentiation の asymmetry を定量
  • Batlle et al. NatMed 2017 が cancer stem cell の revisited framework を提供

限界と注意点

技術的限界

限界影響対処法
Barcode 多様性不足Low-complexity library → 同一 barcode 重複 (collision) → false clone mergingLibrary complexity > 10x cell number を確保。Collision rate を computational に推定
MOI 制御High MOI → 1 細胞に複数 barcode → 解析複雑化。Low MOI → labeling efficiency 低下MOI 0.3-0.5 で single integration を target
scRNA-seq barcode captureBarcode 検出率 < 100% (3’ capture の場合 barcode が 5’ に位置すると drop)Barcode を 3’ UTR に配置 / dedicated barcode amplicon library
CRISPR scratchpad indel saturationLong-term tracing で target site が full saturation → 新規 scar 蓄積不可 → 時間情報喪失Multi-target array / inducible design (CARLIN) / self-targeting homing guide (MARC1)
In vivo delivery 効率Viral barcode を autochthonous tumor に均一導入困難GEMM に germline barcode system を組み込む / 初期 initiation 段階で label
Epigenetic silencingReporter / barcode の promoter methylation → signal loss over timeCMV → EF1α / CAG promoter で silencing 耐性向上
Bottleneck artifact移植 / 治療による bottleneck → 少数 clone が非生物学的に enrichedPre-treatment barcode sampling で baseline diversity を記録

解析的 pitfall

  1. Survivor bias: 治療後に回収される barcode は survivor のみ → 「消えた clone」の情報は lost。治療前 sampling で full diversity を capture し、消失 clone を inference
  2. Clone size vs fitness: 大きい clone = fit とは限らない。Stochastic drift (neutral evolution) で size 差が生じる → Williams et al. NatGenet 2016 の neutral evolution test と組み合わせ
  3. Temporal resolution の限界: Lentiviral barcode は static (一度のラベル) → 中間時点の branching を reconstruction 不可。CRISPR scratchpad は累積 scar で中間 history を encode するが resolution は scar rate に依存
  4. Spatial sampling bias: 組織の一部のみ解析 → rare clone / spatially restricted clone を miss。Whole-organ digestion + bulk barcode で coverage 確保
  5. Cross-contamination: barcode PCR amplification 中の index hopping / cross-contamination → false clone sharing between samples。Unique dual index + stringent filtering

生物学的考慮事項

  • Label timing と interpretability: 「いつ label したか」が結果の解釈を決定する。Tumor initiation 前 label → cell-of-origin。Established tumor label → clonal dynamics。Treatment 前 label → resistance clone pre-existence
  • Clone ≠ Cell type: 同一 clone 内の細胞が heterogeneous な表現型を持ちうる (non-genetic diversity) → clone identity と cell state を独立した axis として扱う
  • Barcode → fitness inference の non-triviality: Clone size は fitness + neutral drift + stochastic extinction の composite → mathematical modeling (birth-death process) で fitness estimation

Open Questions

  • 時間 + 系譜 + 状態 + 空間の四重統合: CRISPR scratchpad (系譜 + 時間) + scRNA-seq (転写状態) + spatial transcriptomics (空間) + live imaging (動態) の full integration。Computational challenge (tree reconstruction + spatial embedding + state mapping の joint inference) が major bottleneck
  • Clinical 応用 — 患者 sample への翻訳: Naturally occurring somatic mutation (SNV / CNV / mtDNA mutation) を “endogenous barcode” として患者腫瘍の clonal architecture を reconstruct。ctDNA-based clonal tracking は Clonal-evolution-ITH / TRACERx で先行
  • DTP / 耐性 clone の治療前予測: Barcode + scRNA-seq で定義された DTP transcriptomic signature を、biopsy sample で barcode なしに detection → patient stratification biomarker への translation
  • Lineage plasticity の reversibility: 一度 plastic 状態 (HPCS / mesenchymal / NE) に移行した clone の re-differentiation potential。「不可逆転換 vs 可逆状態」を lineage tracing で temporal resolution を持って追跡
  • Metastatic seeding pattern の disease / model 依存性: Polyclonal (Quinn et al. Science 2021 xenograft) vs monoclonal (TRACERx human) の discrepancy resolution。Model system の impact vs genuine biology の区別
  • In vivo CRISPR lineage recording の長期安定性: CARLIN / MARC1 の scar saturation 問題。Self-renewing barcode / prime editing-based recording の次世代 platform development
  • Immune-tumor co-evolution の clone-resolved 追跡: Tumor barcode + TCR-seq 同時取得 → 特定 tumor clone を認識する T cell clone の temporal dynamics
  • Dormancy reactivation の trigger 同定: Dormant DTC の lineage tracing + perturbation screen → 覚醒 trigger の systematic identification

重要論文 Top 10

  1. ★★★★★ Bhang et al. NatMed 2015 — ClonTracer — EGFR-TKI 耐性 clone pre-existence 実証、cancer barcode tracing の founding methodology
  2. ★★★★★ Quinn et al. Science 2021 — Barcode metastasis tracing — polyclonal seeding / organ tropism / metastatic fitness の quantitative framework
  3. ★★★★★ Chan et al. Nature 2026 — KP lineage tracing で HPCS の polyclonal origin + multi-lineage potential を実証
  4. ★★★★★ Chan et al. Nature 2019 — CRISPR lineage recording の mammalian paradigm — 全身系譜再構築
  5. ★★★★ Fennell et al. Nature 2022 — Non-genetic clonal fitness — barcode + scRNA-seq で epigenetic fitness を定量

関連エンティティ・概念