• 著者: Koboldt DC, Steinberg KM, Larson DE, Wilson RK, Mardis ER
  • Corresponding author: Mardis ER (Washington University Genome Institute, St. Louis, MO)
  • 雑誌: Cell
  • 発行年: 2013
  • Epub日: N/A
  • Article種別: Review
  • PMID: 24074859

背景

NGS (next-generation sequencing) 技術の登場以前、ゲノム解析は小型ゲノムの生物種や特定の疾患関連単一遺伝子の解析に限定されていた。嚢胞性線維症 (cystic fibrosis) やハンチントン病 (Huntington disease) などの単一遺伝子疾患に対する positional cloning アプローチ、および EGFR 変異と tyrosine kinase inhibitor (TKI) 感受性との関連 (Lynch et al. NEnglJMed 2004) に代表される単一遺伝子の PCR + Sanger シーケンシング解析が主流であった。ヒトゲノム参照配列の完成は NGS の短リードアライメント基盤を提供し、その後の指数関数的なシーケンシングコスト低下が大規模ゲノム解析への移行を加速した。

2000年代に盛んに行われたゲノムワイド関連解析 (GWAS, genome-wide association study) は、数十万の SNP (single-nucleotide polymorphism) をマイクロアレイでジェノタイピングし、薬理ゲノミクス分野 (VKORC1、CYP2C9、CYP4F2 ジェノタイプに基づくワルファリン用量調節)、クローン病、加齢黄斑変性等で成果をあげた。しかし GWAS は効果量の大きな共通バリアントの同定において限界があり、複雑疾患における「missing heritability (説明できない遺伝率)」の問題が顕在化した (Manolio et al., 2009)。稀少バリアントが複雑形質の遺伝率の相当部分を説明しうるという仮説 (Cohen et al., 2006) を検証するためには、従来の Sanger シーケンシングでは対応できないスループットが不足していた point が gap in knowledge として認識された。

本稿は、Washington University Genome Institute の Mardis グループが著し、同号 Cell に掲載された Rivera & Ren (2013) のエピゲノム解析レビューと対をなして、NGS がゲノム研究全体をいかに変革したかを体系的に解説することを意図している。

目的

本レビューの目的は、NGS 技術 (プラットフォーム、ライブラリー調製法、バイオインフォマティクス解析手法を含む) の進化がゲノミクス研究に与えた広範な影響を体系的に整理することである。具体的には、(1) 希少メンデル遺伝病における WES (whole-exome sequencing) の役割、(2) 複雑疾患における稀少変異の統計的解析手法、(3) 癌体細胞変異の検出アルゴリズムと腫瘍内不均一性の解明、(4) ctDNA (circulating tumor DNA) を用いた液体生検 (liquid biopsy) および NIPT (noninvasive prenatal testing) への臨床応用について主要研究の知見を横断的に示し、NGS が疾患遺伝学のパラダイムをいかに変革したかを明らかにする。

結果

NGS の技術的基盤:シーケンシング手法とゲノム解析アーキテクチャの多様化: NGS データ生成の技術的アプローチとして、PCR マルチプレックスアンプリコン型・ハイブリッドキャプチャー型・WGS の 3 種が確立された。ハイブリッドキャプチャー法はビオチン標識プローブによる DNA フラグメントの選択的補足を原理とし、ストレプトアビジンビーズで磁気的に捕集した後、非標的領域は洗い流す。全タンパク質コードエクソン (エクソームシーケンシング、ヒトゲノム全体の約1%) を標的とするアプローチが広く実装された。WGS は構造変異 (逆位・重複等) の検出が可能な一方でデータ量が膨大であるため、エクソームシーケンシングとは用途に応じて使い分けられる。バイオインフォマティクス面では、参照ゲノムへのリードアライメントを基盤とした変異検出ツール群が整備され、生殖細胞系 SNP やインデル (小挿入・欠失) の高スループット解析が可能となった。体細胞変異検出に特化したアルゴリズム群 (Strelka、VarScan 2、MuTect) は、腫瘍純度が低いサンプルや低頻度体細胞変異の検出において従来の Sanger 法を大幅に上回る感度を実現した。ゲノムワイドなバリアントカタログとして、dbSNP (生殖細胞系) と COSMIC (癌体細胞) が参照データベースとして機能し、発見された変異の病的意義評価を支援している。

希少メンデル遺伝病研究の飛躍的加速:OMIM収載件数の約87%増と初期成功例の蓄積: NGS 普及の象徴的な成果として、OMIM に収録された分子基盤が判明している遺伝性表現型の数が、2007年1月の2,048件から2013年7月には3,834件へと約87%増加した (Table 1)。遺伝形式別では常染色体性が1,851件→3,525件と最大の増加を示し、X連鎖性も169件→277件に拡大した。この急増は、WES の登場によって n=2〜10 例の少数罹患者サンプルから疾患原因遺伝子を同定することが現実的となったことを直接反映している。「エクソームプロジェクトの約60%で新規メンデル遺伝病遺伝子を同定できる」との推定 (Gilissen et al., 2012) が本技術の有効性を端的に示す。2009〜2010年の初期応用例として、Miller 症候群 (DHODH、3家系4例)、Kabuki 症候群 (MLL2、n=10例)、Sensenbrenner 症候群 (WDR35、n=2例)、Schinzel-Giedion 症候群 (SETBP1、n=4例)、Kaposi 肉腫 (STIM1、n=1例)、家族性 ALS (amyotrophic lateral sclerosis) (VCP、n=2例) など14疾患の原因遺伝子が WES で同定された (Table 2)。家系研究においても、WES が 4 世代家系の Charcot-Marie-Tooth 病 (DYNC1H1 変異) や、肺動脈性肺高血圧症 (CAV1 フレームシフト変異)、多世代にわたるパーキンソン病家系 (VPS35 変異) を同定するなど成果を上げた。一方、標的塩基の約5%は確実な変異検出に至らないこと、構造変異・繰り返し配列変異 (例: 家族性 ALS フィンランド集団の約50%を占める C9orf72 ヘキサヌクレオチドリピート伸長) がエクソームシーケンシングでは検出困難なこと、dbSNP には OMIM や COSMIC に登録された病的変異も含まれるため GMAF < 0.001 の超稀少変異を機械的にフィルタリングすると疾患原因変異を誤除外するリスクがあること、および網膜色素変性症 (retinitis pigmentosa, RP) では常染色体優性と診断された家系の8.5%が実際は X 連鎖性であるなど診断の落とし穴が指摘された。また GWAS ピーク下の標的再シーケンシング戦略として、ヒスパニック系集団の ADIPOQ 遺伝子に稀少コーディング変異が同定され血漿アディポネクチン濃度の分散の17%を説明するとの知見 (Bowden et al., 2010)、および多発性硬化症 GWAS で同定された 288 Kbp 領域が標的キャプチャー NGS により 86.5 Kbp ハプロタイプブロック (SNP n=42) まで精密マッピングされた事例 (Cortes et al., 2013) が示された。

複雑疾患の稀少変異解析とde novo変異研究の進展: GWAS による共通変異解析で説明できない「missing heritability」問題への対応として、NGS による稀少変異の大規模解析へのパラダイムシフトが加速した。稀少変異の統計的検定では、単一バリアントではサンプルサイズが不足して検出力が低い問題を克服するため、遺伝子単位でバリアントを集積し累積効果を評価するバーデン検定 (burden test) が開発された。特に SKAT (sequence kernel association test) ファミリーが広く採用され、SKAT-O は双方向効果と一方向効果の検定を組み合わせることでいずれの遺伝的構造においても良好な検出力を発揮した。De novo 変異 (DNM, de novo mutation) 研究では、WGS により各個人のゲノムには平均約74個の生殖細胞系 DNM が存在し、父親の年齢との相関も確認されることが明らかとなった (Conrad et al., 2011)。各 n>100 家族を対象とした 4 つの大規模自閉症スペクトラム障害 (ASD, autism spectrum disorder) 研究 (Iossifov et al., Sanders et al., Neale et al., O’Roak et al., 各 2012) がいずれも患者での高い DNM 率を確認し、散発性疾患における DNM プロセスの重要性が示された (Figure 2 の稀少変異発見の急増と対応)。脆弱 X 症候群類似の精神遅滞 (n=10例で9遺伝子が同定)、先天性心疾患 (ヒストン修飾因子遺伝子)、統合失調症 (NMDA (N-methyl-D-aspartate) 受容体遺伝子経路の稀少変異、多世代家族研究) への知見が蓄積し、DNM が散発性発症の重要な分子機構として位置付けられた。家族性研究においても、コンサンギニティ家系の homozygosity mapping と WES の組み合わせや、複数世代・多発症例家系での稀少変異同定など、家族構造を活用した解析デザインが有効であることが示された。

癌ゲノミクスの革新:体細胞変異高感度検出と腫瘍内クローン進化の実証: 腫瘍−正常ペア比較解析のために特化した体細胞変異検出アルゴリズムが開発された。Strelka (Saunders et al., 2012) は腫瘍・正常の対立遺伝子頻度を連続変数として扱うベイズアプローチを採用し、低腫瘍純度サンプルでも高感度を保つ設計である。VarScan 2 (Koboldt et al., 2012) はヒューリスティックと統計的検定を組み合わせて SNV、インデル、LOH (loss of heterozygosity)、ソマティックコピー数変化を統合解析する。MuTect (Cibulskis et al. NatBiotechnol 2013) はベイズ分類器による腫瘍特異的変異検出に加え、panel of normals フィルタリングで稀な偽陽性を系統的に排除する設計を持ち、腫瘍内低頻度サブクローン変異の検出において特に優れた感度を発揮する。腫瘍内不均一性 (intratumor heterogeneity) 解析では、急性骨髄性白血病 (AML, acute myeloid leukemia) の初発−再発ペア n=8 例の WGS (Ding et al., 2012) により、創始クローンおよび派生サブクローンの変異クラスターが同定された。再発時には化学療法誘発 DNA 損傷を示すトランスバージョン変異の増加が確認され、化学療法によるクローン選択の分子的実証となった。腎細胞癌の多部位サンプリング (n=4腫瘍、エベロリムス臨床試験から) の WES + SNP アレイ + 遺伝子発現アレイ (Gerlinger et al. NEnglJMed 2012) では、分岐進化パターンが示され、SETD2、KDM5C、PTEN における空間的に分離した独立変異が収斂表現型進化 (phenotypic convergent evolution) として実証された。乳癌 (n=20例、うち1例は 188x 深度シーケンシング) の解析 (Nik-Zainal et al., 2012) では、ベイズ Dirichlet プロセスによるクラスタリングで変異蓄積の階層的時系列が再構築された。COSMIC データベースでは、ユニーク変異数がサブミット数とほぼ同じペースで増加し続けており (Figure 3)、dbSNP で見られる飽和効果がなく大多数の癌変異が腫瘍固有 (private) であることを示す。これは、癌ゲノムの変異ランドスケープが標準的なヒトゲノム多様性とは本質的に異なることを意味する。癌における標的治療と耐性の文脈でも NGS の役割が強調され、治療応答の予測 (EGFR 変異 + TKI) から耐性機序の解明 (細胞経路の迂回による薬剤耐性獲得) まで、NGS が仮説非依存型の全遺伝子スクリーニングとして機能することが示された。

液体生検と非侵襲的出生前診断:臨床応用への展開と現在の限界: 固形腫瘍が血液中に ctDNA (circulating tumor DNA) や CTC (circulating tumor cells) を放出するという性質を利用した「液体生検」アプローチが台頭してきた。ターゲット深度シーケンシングによる血漿中優勢体細胞変異の検出 (Forshew et al., 2012)、既知の染色体転座・構造変異に特異的な NGS 解析による転移性乳癌の動的モニタリング (Diehl et al. NatMed 2008 の概念を発展させた Dawson et al., 2013)、および PAP 検査サンプルからの卵巣癌・子宮内膜癌の遺伝子特異的アッセイによる検出 (Kinde et al., 2013) が報告された。非侵襲的出生前診断では、Lo et al. (2010) が母体血漿 DNA の 65x カバレッジシーケンシングと親の SNP ジェノタイプを組み合わせて胎児全ゲノムの再構築可能性を概念実証した。その後 Kitzman et al. (2012) はフォスミドクローンプーリングによる母体ロングハプロタイプ解決 (phasing) を組み合わせ、母体ヘテロ接合座位での胎児遺伝子型予測精度 >99% を達成し、Hidden Markov model によるde novo 変異・組換えスイッチポイントの検出にも成功した。Fan et al. (2012) は単一細胞を用いた直接決定論的フェージングで父親ゲノムを推定し、分子カウンティングにより胎児ゲノムを >99% 精度で再構築した。現時点では商業的 NIPT は一般的な染色体異数性 (トリソミー 21 等) の検出に限定されており、胎児全ゲノムシーケンシングの広範な臨床実装はシーケンシングコストおよびフェージングの技術的複雑さが主要な limitation とされた。

考察/結論

本レビューは、NGS 技術の普及が単なる実験手法の改善に留まらず、疾患遺伝学の概念的枠組みそのものを根本的に変革したことを体系的に示した。OMIM 収載の分子基盤判明件数が6年間で2,048件から3,834件へと増加した定量的事実は、NGS 以前の時代の positional cloning アプローチとは対照的であり、少数サンプルのエクソームシーケンシングで新規メンデル病遺伝子を日常的に発見できる時代の到来を象徴する。GWAS 時代には共通疾患-共通変異仮説が主流であったが、NGS による大規模稀少変異解析により稀少バリアントが複雑疾患の遺伝率に相当の寄与をする可能性が示された点も、これまでの研究とは相違する重要な知見である。

先行研究との違い: 癌ゲノム研究においても、単一の腫瘍を均一な細胞集団と見なす既報の観点とは対照的に、腫瘍内に複数のサブクローンが共存し分岐進化するという腫瘍不均一性の概念が NGS によって実証された。Lynch et al. NEnglJMed 2004 に代表される単一遺伝子の仮説依存型 Sanger シーケンシングと比較して、NGS は仮説非依存・全遺伝子・低コスト・短時間での変異プロファイリングを可能とした点で本質的に新規な技術革新である。

新規性: 本研究で初めて、OMIM 件数の経年変化という定量的指標によって NGS 普及が希少遺伝病の疾患遺伝子発見を加速させたことが可視化された。癌ゲノムにおける腫瘍内サブクローン構造の解析 (AML の初発−再発クローン進化、腎細胞癌の分岐進化、乳癌の変異蓄積階層)、および ctDNA による液体生検という新規な癌モニタリングアプローチの実証は、これまで報告されていない形での癌の分子的動態の可視化を意味する。

臨床応用: NGS は癌診療において EGFR や KRAS 等の体細胞変異に基づく precision oncology の基盤として不可欠であり、その臨床応用は既に CLIA 認定環境での実施段階に入りつつある。臨床的意義の観点から、Diehl et al. NatMed 2008 の ctDNA モニタリング概念を発展させた液体生検は、治療効果判定と耐性機序解明に臨床的有用性を有し、CT・MRI より低コスト・低侵襲なモダリティとして補完的役割が期待される。ワルファリン薬理ゲノミクス実装などの既存事例を踏まえ、NGS の bench-to-bedside 実装はすでに進行しており、今後は疾患リスク予測・治療選択・腫瘍モニタリング・出生前診断にわたって医療を変革することが見込まれる。

残された課題: 今後の検討課題として、参照ゲノム依存の変異検出手法が参照配列未収録のゲノム多様性を見逃す問題、WGS データの保存・解析インフラのコスト、ゲノムデータのプライバシー保護に係る倫理的課題、返却すべきゲノム情報の範囲と解釈の標準化、および保険適用範囲の決定という社会的課題が残されている。非侵襲的出生前診断においては十分なカバレッジ達成のコストとハプロタイプ解決の技術的複雑さが limitation として、更なる検討が必要である。変異の機能的意義の解釈 (同義変異がタンパク質機能に影響する例など) や、エクソーム外の causal variant の見落としも、NGS が医療に広く実装される前に解決が求められる残された課題である。

方法

本論文はナラティブレビューであり、文献選択は著者らの専門知識に基づき PubMed 収載の主要原著論文・レビュー論文から行われた。解析対象として参照されたデータベースは OMIM (Online Mendelian Inheritance in Man)、COSMIC (Catalogue of Somatic Mutations in Cancer)、および NCBI dbSNP の各登録推移データであり、各データベースの成長曲線が経年的に定量化された。技術的アプローチの比較にあたっては、PCR マルチプレックスアンプリコン法、ハイブリッドキャプチャー法 (エクソームシーケンシング・ターゲットパネル)、および WGS (whole-genome sequencing) の特性・原理・適用範囲が体系的に記述された。変異検出アルゴリズムとして生殖細胞系変異ツール (GATK、VarScan、Samtools、BWA 等) および体細胞変異ツール (Strelka: ベイズ (Bayesian) モデル、VarScan 2: ヒューリスティック + 統計的検定、MuTect: ベイズ分類器 + panel of normals フィルタリング) の原理と性能が比較された。稀少変異の統計解析では、バーデン検定として SKAT (sequence kernel association test)、SKAT-O 等のファミリーが詳細にレビューされた。de novo 変異同定ツール (DeNovoGear, Polymutt, GATK) の機能比較も行われ、親子トリオ (mother, father, child) の家系情報を組み合わせてゲノムワイドに de novo 変異を同定するアプローチが整理された。