Long-read RNA-seq (Iso-seq / Direct RNA-seq)

一行要約

Long-read RNA-seq (PacBio Iso-seq / ONT direct RNA-seq) は数 kb の RNA / full-length cDNA を 1 分子で読み取り、short-read RNA-seq では曖昧な full-length isoform / alternative splicing / fusion gene の正確な breakpoint / 5’-3’ polarity を高精度に決定する手法。NSCLC では NRG1 fusion partner や EML4-ALK variant の正確な構造決定、SCLC では RB1 / TP53 splicing variant、IO 領域では neoantigen 由来 splicing isoform 検出に応用。

原理

(1) PacBio Iso-seq: poly(A) RNA → SMRTbell circular template → ZMW で循環読み取り → CCS (HiFi) reads (Q30+, 1-15 kb full-length transcript)。MAS-Iso-seq は programmed cDNA concatenation で throughput 5-10 倍化。(2) ONT direct RNA-seq: poly(A) RNA を逆転写なしで直接 nanopore 通過、cDNA bias なし、native modification (m6A, pseudouridine) 検出可能。(3) 解析: minimap2 / IsoQuant / FLAIR で isoform discovery、TAMA / SQANTI3 で transcript model curation、JAFFA / Arriba で fusion calling。

主要エビデンス / 適用領域

  • NSCLC fusion: EML4-ALK variant (V1 / V2 / V3) の正確な breakpoint 決定、治療反応 / 耐性パターン (V3 = lorlatinib early resistance) との相関
  • NRG1 fusion partner: 多様な partner gene (CD74 / SLC3A2 等) の full-length 同定、zenocutuzumab 治療標的化
  • Splicing isoform: SCLC RB1 alternative splicing, NSCLC EGFR vIII 様 truncation isoform
  • Neoantigen splicing: tumor-specific cryptic exon / intron retention 由来 neopeptide 同定
  • Allele-specific expression: long-read で SNV phasing → allele level 発現解析
  • RNA modification atlas: ONT direct RNA で m6A patterns of cancer-relevant transcripts

適用分野と限界

  • 強み: full-length isoform / fusion partner 正確同定、splicing complexity 解像、direct RNA で modification 検出、PCR-free (bias 軽減)
  • 限界: throughput / cost が short-read に劣る (low-expression transcript で under-coverage)、quantification accuracy は MAS-Iso-seq 等で改善中、bioinformatics pipeline の選択依存性、phenotype × isoform link は scale で困難

Open Questions

  • Single-cell long-read RNA-seq: ScNanoGPS / scIsoSeq の標準化
  • Clinical fusion panel: long-read を NCC/NCI 標準パネルに導入する pathway
  • Quantification accuracy の short-read 並水準への到達
  • m6A / pseudouridine の cancer-specific functional impact

関連エンティティ