• 著者: Elaine R. Mardis
  • Corresponding author: Elaine R. Mardis (McDonnell Genome Institute, Washington University)
  • 雑誌: Nature Protocols
  • 発行年: 2017
  • Epub日: 2017-01-05
  • Article種別: Protocol
  • PMID: 28055035

背景

サンガー法 (1977年) による第1世代シーケンシングはヒトゲノム解読の礎を築いたが、スループットとコストの面で限界があった。2005年頃から次世代シーケンシング (NGS) が商業化され、合成によるシーケンシング (SBS)、ライゲーションによるシーケンシング (SBL)、シングル分子シーケンシング (SMS) が相次いで登場した。NGSによりゲノムシーケンシングコストは急激に低下し (10年間で100万分の1以上)、ゲノム医学や精密医療への応用が急速に現実化した。2006年から2016年の10年間で、Illumina、454/Roche、ABI SOLiD、Ion Torrent、Pacific Biosciences、Oxford Nanopore、GeneReaderなど多数のプラットフォームが登場し、各々の特性と限界が実証されてきた。しかし、この10年間の技術進歩の総括と将来展望を体系的に論じるレビューは不足しており、特に技術発展、生物学的応用、臨床実装の三者の相互関係を包括的に評価する必要があった。例えば、これまでのレビューでは個別のプラットフォーム技術仕様に焦点が当てられることが多く、これらの技術がゲノムワイドな解析手法と統合され、基礎研究から臨床診断、特にがん医療における個別化医療への応用が加速している側面については、体系的な議論が手薄である。Metzker et al. NatRevGenet 2010Goodwin et al. NatRevGenet 2016といった先行研究は技術の進歩を報告しているが、本レビューで提示するような広範な臨床応用への展望まで踏み込んだ議論は不足していた。

目的

本レビューの目的は、2006年から2016年の10年間にわたるNGS技術の発展(ライブラリー構築、SBS/SBL/SMSプラットフォーム、計算解析、臨床応用)を体系的に概説し、各プラットフォームの特性比較、限界、および将来の方向性を論じることである。

結果

NGSライブラリー構築の革新: サンガー法が1週間以上を要したのに対し、NGSライブラリーは約2日で作製可能であり、入力DNA源の多様性 (ゲノムDNA、PCR産物、ChIP、逆転写RNA、ATAC-seqなど) が大きな利点となった。特にTn5トランスポザーゼによるタグメンテーション法 (Nextera) はライブラリー構築をさらに迅速化・簡略化した。これにより、ChIP-seq、RNA-seq、ATAC-seq、メチル-seqなど多様な全ゲノム規模の解析が実用化された。

SBSプラットフォームの比較 (Table 1): 各商業SBSプラットフォームの特性は大きく異なる。Illuminaは150-300 bpのペアエンドリード、最高スループットで複雑ゲノム、RNA-seq、体細胞変異検出の標準となった。454/Rocheは400 bpリードで細菌・ウイルスゲノム、多重PCR産物に適したが2016年に商業化終了した。Ion Torrentは200-400 bpリードで感染症・体細胞変異検出に特化している。Qiagen GeneReaderは107 bpリードで腫瘍パネル・液体生検に特化している。ABI SOLiDはライゲーション法 (SBL) で75 bpリードを提供した。

シングル分子シーケンシング (SMS) の台頭: Pacific Biosciences RSII (Single-Molecule Real-Time Sequencing) は40 kb超のリードを生成可能で、複雑ゲノムのde novoアセンブリ、融合遺伝子検出、メチル化検出に優れる。CHM1 (hydatidiform mole cell line 1) ハプロイドゲノムの解析では、26,000以上の挿入・欠失イベントがIlluminaで未検出であったことを示し、短リードアライメントの構造変異検出限界を実証した。Oxford Nanoporeはポアを通過するDNA鎖の電気伝導度変化で塩基を決定する革新的原理を持ち、可変長リード (ロングリードが可能) とMinIONでの現場シーケンシングが特徴であるが、当時はエラー率とスループットが課題であった。

計算解析の発展と限界: NGSリードは基本的にリファレンスゲノムへのアライメントを要するが、ヒトゲノムの大きさ (3 GB)、複雑性 (48%反復配列)、遺伝子ファミリー、偽遺伝子が正確なアライメントの障壁となった。パイプラインとバリアントコーリングの改善が急速に進んだが、短リードでは構造変異 (50-5000 bpのindelなど) の偽陽性率が高い。単一ヒトリファレンスゲノムへの依存が、集団多様性・新規配列コンテンツの同定を困難にする問題も指摘された。Li et al. Bioinformatics 2009は、アライメントツールの進歩に貢献した。

10Xゲノミクス等の新アプローチ: 10X Genomicsは、長いDNA分子をバーコードで標識後Illuminaで短鎖シーケンシングし、計算的に長鎖アセンブリを再現する技術を商業化した。1 ngという低入力量での全ゲノムカバレッジとハプロタイプ分解アセンブリを実現し、短リードの欠点を補完する。

臨床応用への展望: NGS技術の臨床実装として、腫瘍変異プロファイリング (ドライバー変異の同定・標的治療選択)、遺伝性がん素因変異の検出、免疫チェックポイント応答予測のためのTMB測定、個別化ネオアンチゲンワクチンの設計が実現しつつある。特にStadler et al. JClinOncol 2016の事例では、単一がん遺伝子パネルで標的治療、遺伝リスク、免疫療法応答の三者を同時評価できることが示された。神経代謝疾患でのエクソームシーケンシング統合解析では68%の患者が診断を得た。Le et al. NEnglJMed 2015Rizvi et al. Science 2015は、TMBが免疫チェックポイント阻害薬への応答予測因子となる可能性を示した。

考察/結論

本Perspectiveは2006年から2016年のNGS技術の10年間の進歩を俯瞰し、SBS、SMS、計算解析の統合により生物医学研究と臨床診断が変革されたことを体系的に示した。

先行研究との違い: 先行のNGSレビューが個別プラットフォームの技術仕様に焦点を当てていたのに対し、本論文は技術発展、生物学的応用、臨床実装の三者の相互関係を論じた点でこれまでと異なる。特に、International human genome sequencing consortium et al. Nature 2004がヒトゲノムの完成に貢献した一方で、その後のNGS技術がどのように多様な生物学的質問に応え、臨床応用へと進化したかについて、包括的な視点を提供している点が特徴である。

新規性: 本研究で初めて、過去10年間のDNAシーケンシング技術の進化を包括的にレビューし、次世代シーケンシング(NGS)およびシングル分子シーケンシング(SMS)プラットフォームの技術的進歩と臨床応用への展望を提示したことは新規性がある。特に、長鎖リードシーケンシングが複雑なゲノム領域の解析において短鎖リードの限界を克服する可能性を具体的に示した点は、これまで報告されていない知見を統合したものである。

臨床応用: NGSの精密医療への統合 (コンパニオン診断、TMB、MSI測定) はすでに規制承認を得て日常診療に実装されており、本論文が描いた将来像の多くが現実化した。Oxford Nanoporeの急速なエラー率改善とPacBio Sequelシステムの登場により、長リードシーケンシングによる複雑ゲノム構造変異の標準的評価が実現しつつある。これらの技術は、神経代謝疾患の診断率を68%に向上させ、がん医療における個別化医療を加速させる臨床的意義を持つ。

残された課題: 今後の検討課題として、反復配列や構造変異の正確な検出、NGSデータの計算解析・保存インフラのコスト、多様な集団のリファレンスゲノム整備、臨床実装のための品質管理・標準化、および遺伝カウンセリングと偶発的発見への対応が残されている。Limitationとして、単一の参照ゲノムへの依存が新規ゲノムコンテンツの発見を制限する可能性も指摘されている。

方法

本論文は、2006年から2016年までのDNAシーケンシング技術の進展に関するレビューであり、特定の実験プロトコルや患者コホートの解析は実施されていない。主に公開された研究論文、技術報告、および商業プラットフォームの仕様に基づき、技術的進歩と臨床応用への影響を評価した。このレビューは、既存のデータと知見の統合に焦点を当てており、新規の実験データ生成は含まれない。そのため、細胞株 (例えば A549) やマウスモデル (例えば C57BL/6J) を用いた実験、または特定の統計手法 (例えば Student t-test) の適用は行われていない。