Nanopore / Long-read sequencing
一行要約
Nanopore / long-read sequencing は ONT MinION / PromethION と PacBio HiFi を二大 platform として、数十 kb 以上の DNA/RNA を直接読み取り、構造変異 (SV)・融合遺伝子・ecDNA・native メチル化・full-length isoform を一括検出する第三世代シーケンシング技術であり、NSCLC 領域では complex SV の全容解明 (Sakamoto et al. GenomeRes 2020)、ecDNA 構造解析 (Yi et al. NatRevGenet 2022)、T2T ゲノム完成 (Nurk et al. Science 2022) に不可欠な enabling technology であり、short-read NGS-panel / WES-WGS では解決困難な genomic complexity を解像する。
原理
Oxford Nanopore Technology (ONT)
ONT では、一本鎖 DNA/RNA がタンパク質ナノポア (CsgG 由来ポア + motor protein) を通過する際の イオン電流変化をリアルタイムで計測し、base-calling アルゴリズム (Guppy / Dorado, recurrent neural network / transformer ベース) で塩基配列に変換する (Goodwin et al. NatRevGenet 2016、Shendure et al. Nature 2017)。PCR-free の native sequencing では DNA の化学修飾 (5mC / 5hmC / 6mA) がイオン電流パターンに直接反映されるため、bisulfite 変換なしでメチル化状態を同時検出できる点が最大の差別化要素である。
プラットフォーム一覧:
- MinION: ポータブル (約100 g)、1 flow cell (512 nanopores)、output 約50 Gb / run。POC (point-of-care) / フィールドシーケンシング / 小規模実験に最適
- GridION: ベンチトップ、最大 5 flow cells 同時稼働、中規模スループット
- PromethION: 高スループット (最大 48 flow cells、>10 Tb / run)、WGS / large cohort に対応。Illumina HiSeq / NovaSeq の long-read 対抗
Read length: 通常 10-100 kb、ultra-long library で >1 Mb reads が達成されており、centromere / telomere / segmental duplication 等の complex repeat 領域の spanning が可能。精度: Raw read accuracy は初期の Q7 (約80%) から現行 R10.4 chemistry で Q20+ (約99%) に向上。Duplex sequencing (complementary strand の連続読み取り) で Q30+ (99.9%) が達成されつつある。
Adaptive Sampling (選択的シーケンシング)
ONT 独自の機能として、シーケンシング中にリアルタイムで各 read の塩基配列を判定し、標的外 read を 電気的に reject して標的領域のみを enrichment する adaptive sampling がある。事前の PCR / hybrid capture が不要であり、100-1,000 遺伝子の targeted enrichment を wet-lab preparation なしで実現する。臨床応用では rapid tumor profiling (<24 時間 TAT) の可能性が検討されている。
PacBio SMRT / HiFi Sequencing
PacBio は Zero-Mode Waveguide (ZMW) 内で DNA polymerase が circular template (SMRTbell) を反復的に読み取る 単分子リアルタイムシーケンシング (SMRT) を行う (Metzker et al. NatRevGenet 2010)。反復読み取りの consensus で HiFi reads (>Q30, 99.9% accuracy, 10-25 kb) を生成し、long-read の高精度版を提供する。
Revio platform (2023 年発売) は 25M ZMW / SMRT Cell で output >90 Gb / cell を達成し、cost-per-Gb を大幅に低下させた。HiFi reads は accuracy で ONT raw reads を凌駕し、small variant calling (SNV / indel) で short-read に匹敵する precision を実現する一方、read length は ONT ultra-long に劣る (HiFi: 10-25 kb vs ONT: >100 kb)。
Short-Read NGS との比較
| 特性 | ONT (R10.4) | PacBio HiFi | Illumina Short-Read |
|---|---|---|---|
| Read length | 10-100 kb (>1 Mb 可能) | 10-25 kb | 150-300 bp |
| Raw accuracy | Q20-Q30 | Q30+ (>99.9%) | Q30+ (>99.9%) |
| Native methylation | 可 (5mC / 5hmC / 6mA) | 可 (5mC kinetics) | 不可 (bisulfite 必要) |
| SV 検出 | 優秀 (spanning) | 優秀 | 限定的 (split-read / discordant pair) |
| Repeat 解決 | 優秀 | 優秀 | 困難 |
| スループット | PromethION: >10 Tb | Revio: 360 Gb/day | NovaSeq X: >16 Tb |
| コスト / Gb | $10-30 | $10-20 | $2-5 |
| 臨床 validation | 研究段階 | 研究段階 | 確立済み |
Long-read は SV / repeat / methylation / isoform で圧倒的優位を持つが、cost / throughput / established clinical pipeline で short-read が依然として dominant である (Mardis et al. NatProtoc 2017)。
主要エビデンス / 適用領域
NSCLC Structural Variant の包括的検出
Sakamoto et al. GenomeRes 2020 は NSCLC 8 症例で Oxford Nanopore long-read WGS を実施し、short-read WGS では検出困難な complex structural variant (chromoplexy / chromothripsis / tandem duplication chains) の全容を解明した landmark study。特に、short-read で「単純な deletion」と判定されていた変異が long-read で multi-breakpoint の complex rearrangement であることが判明し、SV 検出における short-read の根本的限界を示した。NSCLC の driver fusion (EML4-ALK variant 含む) の breakpoint 構造も full-length spanning で正確に決定された。
Alkan et al. NatRevGenet 2011 は genome structural variation の検出・genotyping 手法を体系的にレビューし、long-read がSV 検出の gold standard となる方向性を示した。Hollox et al. TrendsGenet 2022 は human SV の進化的文脈を整理し、cancer genome における somatic SV 理解の基盤を提供した。
ecDNA (Extrachromosomal DNA) 構造解析
ecDNA はがん細胞に高頻度で見られる circular extrachromosomal DNA であり、oncogene amplification と tumor heterogeneity の driver として注目されている (Yi et al. NatRevGenet 2022、Verhaak et al. NatRevCancer 2019)。ecDNA の構造 (circular topology / enhancer-oncogene interaction / complex rearrangement) は short-read では再構築困難であり、long-read sequencing が構造解明の中核技術となっている。
Morton et al. Cell 2019 は ecDNA 上の functional enhancer が oncogene amplification の構造を決定することを示し、long-read による ecDNA 構造解析の重要性を強調した。Wu et al. Nature 2019 は ecDNA の circular topology が accessible chromatin 状態を促進し高い oncogene 発現を維持することを示した。Hung et al. Nature 2021 は ecDNA hub の cooperative intermolecular 発現を long-read + imaging で実証。Behrouzi et al. TrendsMolMed 2025 は SCLC における cfDNA と ecDNA profiling の最新動向を整理した。
Chromothripsis の解像
Chromothripsis (一回の catastrophic event で数十〜数百の rearrangement が同時発生する現象) は short-read WGS では breakpoint の正確な phasing と reconstruction が困難であり、long-read sequencing が全容解明に不可欠である。Cortes et al. NatGenet 2020 は 2,658 例の WGS で chromothripsis の pan-cancer 頻度と特徴を解析し、肺癌を含む多癌種での高頻度を報告。Rekhtman et al. CancerDiscov 2025 は chromothripsis が SCLC の発生機序に直接関与することを示した。
Fusion Gene / Isoform の Full-Length 検出
Long-read RNA sequencing (Iso-Seq / ONT direct RNA-seq) は、full-length transcript を PCR-free で読み取り、alternative splicing isoform の完全構造を決定する。AlKhafaji et al. NatBiotechnol 2024 は programmed cDNA concatenation による high-throughput RNA isoform sequencing を開発し、long-read の throughput 制限を克服した。
肺癌の driver fusion (EML4-ALK / ROS1 fusion / RET fusion / NTRK fusion) は breakpoint 位置により variant type が異なり治療応答に影響する。Short-read NGS panel は breakpoint 近傍の短い read でfusion を推定するが、large intronic breakpoint や complex fusion では false negative となる。Long-read は fusion transcript / genomic breakpoint を full-length spanning で正確に同定し、FISH / IHC / short-read panel の discordant case の解決に有用。
Native Methylation 検出と Epigenomic Profiling
ONT native methylation detection は bisulfite 変換 (DNA 損傷 + C/T conversion artifact) を回避し、FFPE 検体を含む低品質 DNA にも適用可能である。Choy et al. ClinChem 2022 は single-molecule sequencing を cfDNA に適用し、methylation + fragment length + mutation の同時検出を実現した。Lo et al. Science 2021 は liquid biopsy における epigenetics / fragmentomics / topology の統合 vision を提示し、long-read の cfDNA 解析への応用可能性を示した。
5mC に加え 5hmC / 6mA 等の修飾 base を同時検出できる点は long-read の独自優位であり、cancer epigenome の包括的理解に貢献する。Altemose et al. Science 2022 は centromere の完全 epigenetic map を long-read で構築し、repeat-rich 領域の epigenomic profiling における long-read の不可欠性を示した。
T2T ゲノムと参照配列の完成
Nurk et al. Science 2022 は T2T (Telomere-to-Telomere) Consortium による human genome の完全配列を報告。ONT ultra-long reads + PacBio HiFi の hybrid assembly で、centromere / acrocentric short arm / segmental duplication 等の従来 gap であった 約8% の genome を初めて解読した。この complete reference は cancer genome analysis の精度向上 (SV calling / copy number estimation / repeat annotation) に直結する。International human genome sequencing consortium et al. Nature 2004 からの 18 年越しの genome 完成であり、long-read technology の enabling power を象徴する achievement。
cfDNA への Long-Read 応用
Penny et al. BiochemCellBiol 2024 は liquid biopsy における chromatin / nucleosome 関連 feature と cancer biomarker discovery の関連を整理し、long-read による cfDNA fragment 構造解析の可能性を論じた。Song et al. NatBiomedEng 2022 は cfDNA 解析技術全体の limitation と opportunity を包括レビューし、long-read の独自ポジション (methylation + fragment + mutation の同時検出) を整理した。
限界と注意点
- Raw accuracy の課題: ONT R10.4 の raw accuracy (Q20-Q25) は Illumina (Q30+) に劣り、homopolymer 領域 (AAAA / CCCC 等) での systematic error が残存。Consensus calling / duplex reads で改善するが、single-read での SNV calling は信頼性が不十分
- スループット / コスト: PromethION / Revio で改善しているが、population-scale WGS ではIllumina に対し cost-per-Gb で 3-5x 高コスト。Large cohort study の routine 適用には更なるコスト低下が必要
- DNA 品質依存性: Read length は input DNA の分子量に直結するため、FFPE 検体 (断片化 200-500 bp) では long-read の最大利点が失われる。Fresh frozen / snap-frozen 検体が推奨されるが、臨床検体の availability が制約
- Bioinformatics の成熟度: Long-read の alignment / variant calling / assembly ツール (minimap2 / Clair3 / Shasta / hifiasm) は急速に発展しているが、short-read ecosystem (BWA / GATK / Mutect2) の validation depth には及ばない。Clinical-grade pipeline の standardization は進行中
- 臨床 validation の不足: Long-read の SV / methylation 検出は research-grade であり、FDA / PMDA 承認の臨床検査 (IVD) としての validation は未完。Regulatory pathway の確立が臨床実装の bottleneck
- Data storage / computational load: Ultra-long reads の raw signal data (FAST5 / POD5) は base-called FASTQ の 5-10x のストレージを要し、base-calling の GPU computational cost が significant
- Multiplexing の制限: ONT の barcoding / multiplexing は Illumina の index multiplexing より成熟度が低く、多検体同時処理の効率に課題
Open Questions
- 臨床 WGS への統合: Long-read WGS が short-read WGS / panel を補完または置換する clinical pipeline の確立。SV / methylation / fusion の unified reporting の standardization
- FFPE 検体対応の技術的克服: FFPE DNA の断片化を克服する前処理技術 (enzymatic repair / adaptive sampling の最適化) の進展。Pathology archive の long-read 解析可能性
- Rapid tumor profiling: ONT MinION / adaptive sampling を用いた <24 時間 TAT の rapid genomic profiling (SV + methylation + mutation) の臨床 feasibility 検証。Intraoperative molecular diagnosis への応用
- ecDNA の動態追跡: Serial long-read WGS / cfDNA long-read で ecDNA の clonal evolution と治療耐性への寄与を longitudinal に追跡する方法論の確立
- Multi-omic long-read: DNA + RNA + methylation + chromatin accessibility を single molecule / single cell level で同時検出する unified long-read platform の開発 (ONT の direct RNA-seq + DNA native methylation の統合)
- Cost parity の到達時期: Illumina との cost-per-Gb parity 達成の timeline。PacBio Revio / ONT PromethION 2 の price trajectory
重要論文 Top 10
- ★★★★★ Sakamoto et al. GenomeRes 2020 — NSCLC で long-read WGS を実施し complex SV の全容を解明、short-read の SV 検出限界を実証
- ★★★★★ Nurk et al. Science 2022 — T2T human genome 完全配列 — long-read technology の enabling power を象徴する landmark
- ★★★★ Yi et al. NatRevGenet 2022 — ecDNA amplification の包括的レビュー — long-read による構造解析の中心性を整理
- ★★★★ AlKhafaji et al. NatBiotechnol 2024 — Programmed cDNA concatenation で long-read RNA isoform sequencing の throughput を飛躍的向上
- ★★★★ Choy et al. ClinChem 2022 — Single-molecule sequencing を cfDNA に適用、methylation + mutation の同時検出を実現
関連エンティティ
- WES-WGS / Methylation-profiling / Bulk-RNA-seq
- ALK / ROS1 / RET
- FISH