Bulk RNA-seq
一行要約
Bulk RNA-seq は組織または細胞集団全体の mRNA を網羅的に定量する transcriptomics の中核手法で、TCGA / TRACERx / IMvigor210 / SU2C-MARK 等のランドマーク omics コホート、IFN-γ / Teff / TGF-β EMT 等の予測シグネチャ開発、そしてオンコジーン融合 / splicing 変動の検出基盤として、現代腫瘍学の量的言語そのものを規定している。
原理
組織または細胞集団から total RNA を抽出し、mRNA enrichment (poly-A selection) または rRNA depletion 後に cDNA ライブラリを調製、Illumina 等の short-read sequencer で大量並列シーケンシングを行う。reads を reference genome にマッピングし、STAR / Salmon / kallisto で遺伝子ごとの read count を定量、DESeq2 や edgeR の負の二項モデルで群間差次発現を検出する。Long-read 技術 (PacBio / Oxford Nanopore) は同一サンプルから isoform レベル定量と融合遺伝子検出を可能にし、bulk と単分子解像度のギャップを埋めつつある (AlKhafaji et al. NatBiotechnol 2024 / Sakamoto et al. GenomeRes 2020)。歴史的・技術的レビューは Hawkins et al. NatRevGenet 2010 / Metzker et al. NatRevGenet 2010 / Goodwin et al. NatRevGenet 2016 にまとまる。
主要エビデンス (応用領域別)
IO 応答予測シグネチャ
抗 PD-1 / PD-L1 応答性の RNA-seq バイオマーカー研究はメラノーマで Cell-2016-Hugo を嚆矢とし、EMT / 間質シグナルが耐性と関連することを示した (Hugo et al. Cell 2016)。膀胱癌の IMvigor210 コホート (n=298) では、CD8 Teff・TMB・TGF-β の 3 コア経路解析から、excluded 表現型における TGF-β 駆動 fibroblast 活性化が T 細胞排除を生み、anti-PD-L1 + anti-TGF-β 併用が有効である機構を確立した (Mariathasan et al. Nature 2018)。NSCLC では SU2C-MARK 393 例の WES + RNA-seq 統合解析 (Ravi et al. NatGenet 2023) が ATM 変異を応答因子 (OR 3.5)、TERT 増幅を耐性因子と同定し、免疫プロテアソーム構成 (PSMB8/9/10) の発現が従来 IFN-γ signature を凌駕する応答予測能を示した。早期 NSCLC neoadjuvant IO の文脈では proliferation signature (Altorki et al. CellRepMed 2024) が応答予測に資し、KRAS 駆動 NSCLC では STK11 共変異が CRTC2 経由で IO 抵抗性をもたらすことが bulk RNA-seq + 機能実験から示された (Robay et al. ProcNatlAcadSciUSA 2026)。
Pan-cancer 横断・免疫景観
Pan-cancer 免疫サブタイピングは TCGA 33 がん種 10,000 超腫瘍を対象とした統合 RNA-seq 解析により C1〜C6 の 6 安定免疫サブタイプを同定し、サブタイプ別の cytolytic activity・TCR/BCR レパートリー・予後との関連を確立した (Thorsson et al. Immunity 2018 / Rooney et al. Cell 2015)。汎がん予後ランドスケープ (Gentles et al. NatMed 2015) と pan-cancer myeloid atlas (Cheng et al. Cell 2021) も bulk と single-cell の橋渡し基盤として参照される。
肺癌 driver / 耐性 / 神経内分泌可塑性
NSCLC では LUAD vs LUSC の発現差異・サブタイプ分類 (Faruki et al. JThoracOncol 2017 / Anusewicz et al. SciRep 2020)、proteogenomic 統合 (Gillette et al. Cell 2020 / Xu et al. Cell 2020) が標準となっている。SCLC では 4 主要 transcription factor サブタイプ (ASCL1 / NEUROD1 / POU2F3 / YAP1) が bulk RNA-seq で確立され治療脆弱性と関連付けられた (Gay et al. CancerCell 2021 / Borromeo et al. CellRep 2016 / Rudin et al. NatRevCancer 2019)。RNA-seq は driver 融合 (Stransky et al. NatCommun 2014 / Nakaoku et al. ClinCancerRes 2014) と alternative splicing 異常 (Kahles et al. CancerCell 2018) の検出基盤でもある。
早期 NSCLC・周術期 ctDNA との統合
予後予測シグネチャの臨床応用検証では、Tang らが既報シグネチャを系統的に評価し、再現性に関する重要な留保を提示している (Tang et al. AnnOncol 2017)。bulk RNA-seq から推定された発現プロファイルは cfDNA fragmentation profile から ML で再構築可能になり (Esfahani et al. NatBiotechnol 2022)、組織 RNA と液体生検の境界が溶けつつある。
適用領域と限界
強み
- TCGA / GEO / SU2C 等大規模公開コホートと互換性が高く、メタ解析・cross-cohort 検証が容易
- IFN-γ / Teff / EMT / TGF-β / proliferation 等 standardized gene signature の開発・適用基盤
- 1 サンプルあたり数万円程度に低価格化、FFPE 対応 protocol (exome capture 系) も成熟
- Splicing / fusion / lncRNA / TE expression 等多様な転写産物を一度に取得
限界
- 細胞集団の平均化: TME 内の細胞種多様性や rare population が失われる (Simpson’s paradox)。CIBERSORTx 等 deconvolution で部分推定可能だが、解像度は scRNA-seq / Spatial-transcriptomics に劣る
- RNA 品質依存: RIN ≥ 6 が望ましく、FFPE では degradation bias と 3’ bias が顕著
- Batch effect: ライブラリ調製 / シーケンサー / lane 由来 bias を ComBat / RUVseq 等で補正しないと偽陽性が増大
- CNV / 構造変異の検出は不得手: WES / WGS との統合が必要
- シグネチャの再現性: cohort 間 / platform 間で robust に動くシグネチャは限定的 (Tang et al. AnnOncol 2017)
重要論文 Top 10
- Thorsson et al. Immunity 2018 — TCGA 33 がん種統合 RNA-seq による 6 免疫サブタイプ確立
- Mariathasan et al. Nature 2018 — IMvigor210 RNA-seq から TGF-β / 免疫排除モデルへ
- Ravi et al. NatGenet 2023 — SU2C-MARK 393 例の NSCLC IO 統合 omics
- Gay et al. CancerCell 2021 — SCLC 4 サブタイプの bulk RNA-seq 確立
- Kahles et al. CancerCell 2018 — pan-cancer splicing landscape の決定版