• 著者: Goodwin S, McPherson JD, McCombie WR
  • Corresponding author: W. Richard McCombie (Cold Spring Harbor Laboratory)
  • 雑誌: Nature Reviews Genetics
  • 発行年: 2016
  • Epub日: 2016-05-17
  • Article種別: Review
  • PMID: 27184599

背景

2005年頃に登場した次世代シークエンシング (NGS) 技術は、従来のサンガーシークエンシングと比較してスループットを劇的に向上させ、コストを大幅に削減した。ヒトゲノムプロジェクト (HGP) 完成時 (2003年) には約3億ドルかかっていた全ゲノムシークエンシングのコストは10年間で50,000倍以上低下し、1,000ドル以下でのヒトゲノム解読が現実的になりつつあった。この技術革命はゲノム研究・臨床診断・産業応用に広範な変革をもたらした。例えば、Bentley et al. Nature 2008は可逆的ターミネーター化学を用いたヒトゲノムシークエンシングの精度を報告し、その後の技術発展の基礎を築いた。また、Metzker et al. NatRevGenet 2010は、NGS技術の概念と限界について包括的にレビューし、その後の研究の方向性を示唆した。さらに、Park et al. (2009) はChIP-seq法の概要とエピジェネティクス研究におけるその重要性をレビューした。一方でNGSはエラー率 (0.1〜15%) ・リード長の制約 (35〜700 bp) ・大規模データ処理の計算コストなど解決すべき課題も抱えており、特にゲノムの複雑な構造変異や長鎖反復配列の解読には短鎖リードでは限界があった。これらの課題に対し、長鎖シークエンシング技術の台頭がその解決策として注目を集め始めていたが、その性能や応用範囲についてはまだ未解明な部分が多く、体系的な評価が不足している状況であった。特に、短鎖リード技術と長鎖リード技術の比較や、既存の代替技術との補完関係について、包括的な情報が不足していた。

目的

本レビューの目的は、NGS技術の約10年間 (2005〜2015年) の発展を短鎖・長鎖シークエンシングを含め体系的に論じ、各プラットフォームの原理・性能・エラープロファイル・ゲノム研究への貢献を詳細に比較評価することである。また、マイクロアレイ・qPCR・光学マッピングなどの既存技術との比較を通じて、NGSの優位性と補完的役割を明確にすることも目的とした。これにより、研究者や臨床医がそれぞれの研究目的や予算に応じて最適なシークエンシング戦略を選択するための包括的な情報を提供することを目指した。特に、短鎖シークエンシングの限界を克服する長鎖シークエンシング技術の台頭と、その潜在的な影響を詳細に分析し、今後のゲノム研究の方向性を示すことを意図した。

結果

テンプレート増幅戦略の多様性: 短鎖NGSでは、配列決定前にクローナルなテンプレート集団を作成する必要がある。主要なアプローチとして、(a) 乳化PCR (emPCR) によるビーズ上増幅 (SOLiD、Ion Torrent、454)、(b) ブリッジ増幅による固相クラスター形成 (Illumina)、(c) DNAナノボール生成とローリングサークル増幅 (Complete Genomics/BGI) の3種類が存在する (Figure 1)。Illuminaのパターン化フローセルでは、定位置にプライマーが結合しており、クラスター密度を劇的に高めることが可能である。これにより、HiSeq Xでは年間約1,800ゲノムを30×カバレッジで解読可能であり、1ランあたりの出力量は数テラベースに達する。例えば、HiSeq Xのコストは約$7/Gbである (Table 1)。

シークエンシング・バイ・ライゲーション (SBL) プラットフォームの特性: SOLiD (Thermo Fisher) は2塩基エンコードプローブを用いたライゲーションシークエンシングにより、各塩基を2回読むことで高精度 (エラー率 ≤0.1%) を実現した (Figure 2a)。しかし、最大リード長75 bp (SE) という短鎖性と、デコンボリューションが必要な「カラースペース」出力形式、数日に及ぶランタイムが普及の障壁となった。BGIのComplete Genomicsはcombinatorial probe-anchor ligation (cPAL) またはcPAS (synthesis版) を採用し、DNAナノボールを用いた特有の手法を展開したが、中国本土でのサービス提供に限定された (Figure 2b)。これらのSBL系プラットフォームはIlluminaに市場シェアを奪われ、SOLiDシステムは現在ニッチな位置づけに後退している。

シークエンシング・バイ・シンセシス:Illumina CRTの優位性: Illumina のCyclic Reversible Termination (CRT) 技術は、3’-O-アジドメチル基でブロックされた可逆的ターミネーター蛍光標識ヌクレオチドの逐次的取り込みを利用する (Figure 3a)。全内部反射蛍光 (TIRF) 顕微鏡で2または4チャンネルのイメージングを行い、脱ブロッキングと蛍光色素除去を繰り返してシークエンシングを進める。2005〜2015年の10年間でリード長は35 bpから250 bp超に延長し、1ランあたりの出力量は数メガベースから数テラベースへ3〜4桁の向上を達成した。2016年時点の主要製品ラインアップでは、MiSeq (最大300 bp PE、15 Gb/run) からHiSeq X (150 bp PE、800〜900 Gb/フローセル、コスト約$7/Gb) まで幅広いスループット・用途に対応し、Illumina が市場シェアの大部分を占める。エラープロファイルはGCリッチ・ATリッチ領域での過少代表とシトシン誤読 (substitution error) が主であり、全体精度は>99.5%である。Bentley et al. Nature 2008は、Illuminaとマイクロアレイで同定されたSNPの高い一致率を報告したが、約2.5%の偽陽性率も指摘した。Qiagen GeneReader はIlluminaと同原理のCRTを採用しつつ、がんパネル解析に特化したオールインワンNGSプラットフォームとして2015年に発売された (Figure 3b)。

シークエンシング・バイ・シンセシス:SNA (Single Nucleotide Addition) 方式: 454ピロシークエンシング (Roche) はdNTP取り込み時のピロリン酸放出からATPカスケードを経て生じる生物発光シグナルを検出する (Figure 4a)。平均450〜700 bpの長いリードを提供する点が特徴であったが、ホモポリマー領域でのindelエラーが多く (1%程度)、コスト高と競争力の低下からRocheは2016年に454プラットフォームを廃止した。Ion Torrent (Thermo Fisher) はdNTP取り込み時に放出されるH+イオンによるpH変化をCMOS (complementary metal-oxide-semiconductor)/ISFET (ion-sensitive field-effect transistor) センサーで検出する光学フリーの初のNGSプラットフォームであり、数時間の短ランタイム (2〜7時間) と小型フォームファクタが特徴である (Figure 4b)。Ion PGM (Personal Genome Machine)/S5シリーズはチップサイズ交換によりスループット調整 (50 Mb〜15 Gb) が可能で、臨床POC (Point-of-Care) 用途や遺伝子パネル解析に適する。ただしS5/Proton系では現状ペアエンドシークエンシングが不可能であり、長距離構造解析に制約が残る。

長鎖シークエンシング技術の登場とゲノム複雑性の解像: ゲノムには多数の長鎖反復配列・構造変異・コピー数変化が存在するが、これらは短鎖NGSリードでは解像が困難である。Pacific Biosciences (PacBio) のSMRT (Single Molecule Real Time) シークエンシングは、特殊フローセル (SMRT cell) 内の数万個のZMW (zero-mode waveguide) において、φ29ポリメラーゼによるリアルタイムDNA合成を蛍光標識ヌクレオチドの取り込みとして検出する (Figure 5a)。平均リード長は10〜20 kbpに達し、長鎖反復配列・構造変異・エピジェネティック修飾 (6mA、5mCなど) の直接検出が可能である。エラー率は約10〜15% (ランダムエラー) と高いが、コンセンサスシークエンシング (SMRT Link解析) により高精度を回復できる (最大99.999%の精度)。Oxford Nanopore Technologies (ONT) のMinIONは数百〜数千本の生物学的ナノポアを並列に配置し、一本鎖DNAまたはRNAがポアを通過する際の電流変化から塩基配列を直接読む (Figure 5b)。リアルタイム解析・USB接続の超小型デバイス (MinION) ・超長リード (50 kb以上も可能) が特徴で、リアルタイム感染症診断や現場ゲノミクスへの応用が期待される。ただし初期のシステムエラー率は高く (1Dリードで最大30%)、PacBioと同様にコンセンサス深度が必要であった。

既存代替技術との比較とNGS応用領域の広がり: マイクロアレイは既知SNPのジェノタイピングに引き続き有用であり、コストはNGSより低い場合が多いが、新規変異の検出には本質的に対応できない。NanoStringのnCounter (最大800ターゲット) は多重RNA発現定量に使われるが、トランスクリプトーム全体の網羅解析にはRNA-seqが優れる。光学マッピング (Bionano) は最大〜1 Mb長のDNA断片を蛍光標識して大型構造変異・コピー数変化を検出し、短鎖NGSデノボアセンブリの長距離スキャフォールドとして補完的に活用される。qPCRは臨床FDA承認検査の金標準として高感度・高特異度を誇るが、同時検出ターゲット数 (数百) ではNGSに及ばない。これらの技術はNGSの競合ではなく多くの場合補完的であり、研究目的・コスト・ターゲット範囲に応じた使い分けが求められる。WGSによるがん全ゲノム解析では、体細胞変異・構造変異・コピー数変化・変異シグネチャーの包括的解析が可能になり、TCGA (The Cancer Genome Atlas) やICGCなどの大規模プロジェクトで数千のがんゲノムが解読された。WES (全エクソームシークエンシング) は遺伝性疾患の原因遺伝子同定 (メンデル疾患診断率約25〜30%) に実績を上げ、臨床遺伝子パネルの基盤となっている。RNA-seqはマイクロアレイを置き換えつつあり、スプライシング変異・融合遺伝子・非コードRNA・発現定量を網羅的に解析できる。ChIP-seqはゲノムワイドなタンパク質-DNA相互作用を解析し、エピゲノム研究の標準ツールとなった。液体生検 (Liquid biopsy) の技術基盤として超高感度NGS (ctDNA検出) が臨床応用されつつあり、早期がん検出・治療効果モニタリング・耐性変異の早期検出への応用が急速に進んでいる。単一細胞解析 (scRNA-seq、scATAC-seq) においてもNGSが中心的技術基盤を担い、細胞タイプの網羅的同定とゲノム-エピゲノム-トランスクリプトームの統合解析が可能になった。

コスト低下の軌跡とシークエンシングコストの現状: 2003年 (HGP完成時) から2015年末にかけて全ゲノムシークエンシングのコストは約50,000倍以上低下した。この低下速度はムーアの法則 (半導体集積度の2年倍増、コスト半減) を大幅に上回る (Table 1参照:HiSeq Xで約1,000以下でのヒトゲノム解読を報告し、数年以内に臨床標準的診断応用が視野に入ってきた。一方、シークエンシング自体のコスト低下に対し、データ解析・保管・臨床解釈のコストが相対的に増大しており、ゲノムデータの生物学的・臨床的意義の解釈がボトルネックとなりつつある。

考察/結論

本レビューはNGS技術の10年間の進化を俯瞰した重要な文献であり、技術的成熟度と臨床・研究への影響を包括的に評価した。短鎖シークエンシング、特にIllumina CRTが確立した基盤の上に、PacBioとOxfordナノポアを代表とする長鎖シークエンシングが登場し、ゲノム研究の解像度・完全性がさらに向上しつつある時期の重要な記録である。先行技術 (454、SOLiD) の廃退とIlluminaの市場独占化という業界動態の記録としても価値が高い。

先行研究との違い: これまでのレビュー論文が個別のNGS技術や特定の応用領域に焦点を当てていたのと異なり、本レビューは短鎖・長鎖の両技術を網羅し、その進化の歴史と将来的な展望を統合的に評価した点で、より広範な視点を提供している。特に、短鎖リード技術の限界を克服する長鎖リード技術の台頭とその潜在的な影響を詳細に分析した点は、本レビューで初めて明確に示された。

新規性: 本レビューは、複数の技術プラットフォームを原理・性能・コスト・エラーモード・適用領域の多角的視点から系統的に比較した包括性において新規性を持つ。特に、長鎖リード技術がゲノムの複雑な構造変異や長鎖反復配列の解読に果たす役割を詳細に分析し、その臨床的・研究的意義を明確に示した点で、これまで報告されていない情報を提供した。

臨床応用: 臨床応用として、遺伝性疾患のエクソーム診断、がん液体生検、感染症メタゲノム診断が急速に進展しており、本レビューはそれらの技術的基盤を整理した。特に、リアルタイムシークエンシング能力を持つONT MinIONが、エボラ出血熱アウトブレイク時の迅速な病原体モニタリングに活用された事例は、臨床現場でのNGSの即時的有用性を示す好例である。これらの技術は、精密医療の実現に向けたbench-to-bedsideのアプローチを加速させる。

残された課題: 今後の検討課題として、長鎖シークエンシングのコスト・エラー率改善、全ゲノム解析の臨床標準化 (バリアント解釈の統一)、ビッグゲノムデータの解析インフラ整備が挙げられる。本論文執筆後の数年で長鎖シークエンシング (PacBio HiFi/ONT Q20+) のエラー率が劇的に改善し、ほぼ予測通りの発展軌跡を辿ったことは本レビューの見通しの正確さを示している。しかし、データ解析と臨床的解釈のボトルネックは依然として残されており、今後の研究の方向性として、これらの課題解決が重要である。

方法

本論文は、NGS技術の約10年間の発展を概観するレビュー論文である。短鎖シークエンシング技術として、Sequencing by Ligation (SBL) 方式のSOLiD (Thermo Fisher) およびComplete Genomics、Sequencing by Synthesis (SBS) 方式のIllumina、Ion Torrent (Thermo Fisher)、454 (Roche) を取り上げた。長鎖シークエンシング技術としては、Pacific BioSciences (PacBio) のSMRT (Single Molecule Real Time) シークエンシングとOxford Nanopore Technologies (ONT) のナノポアシークエンシングを比較した。本レビューは、PubMedやWeb of Scienceなどの主要な科学データベースを用いて、2005年から2015年までの期間に発表された関連論文を広範に検索し、その結果を統合して記述された。各プラットフォームについて、その基本的な原理、リード長、スループット、ランタイム、エラープロファイル、および機器コストとギガベースあたりのコストを詳細に分析し、Table 1に定量的な性能データをまとめた。

さらに、NGSの適用領域として、全ゲノムシークエンシング (WGS)、全エクソームシークエンシング (WES)、RNAシークエンシング (RNA-seq)、クロマチン免疫沈降シークエンシング (ChIP-seq)、単細胞解析などを網羅的に検討した。これらの応用におけるNGSの利点と課題を議論し、既存の代替技術であるDNAマイクロアレイ、NanoString、定量的PCR (qPCR)、光学マッピングとの比較を行った。特に、これらの代替技術がNGSとどのように競合し、あるいは補完し合うかを評価した。データ解析の側面では、各プラットフォームのエラープロファイルに基づいたバリアント検出の課題や、大規模ゲノムデータのストレージとバイオインフォマティクス解析の計算コストについても言及した。本レビューでは、各技術の長所と短所を比較検討し、特定の研究目的や臨床用途における最適な選択肢を提示することを目指した。また、各技術の市場動向や将来的な展望についても考察した。