- 著者: Donavan T. Cheng, Talia N. Mitchell, Ahmet Zehir, Ronak H. Shah, Ryma Benayed, Aijazuddin Syed, Raghu Chandramohan, Zhen Yu Liu, Helen H. Won, Sasinya N. Scott, A. Rose Brannon, Catherine O’Reilly, Justyna Sadowska, Jacklyn Casanova, Angela Yannes, Jaclyn F. Hechtman, Jinjuan Yao, Wei Song, Dara S. Ross, Alifya Oultache, Snjezana Dogan, Laetitia Borsu, Meera Hameed, Khedoudja Nafa, Maria E. Arcila, Marc Ladanyi, Michael F. Berger
- Corresponding author: Michael F. Berger, Ph.D. (Department of Pathology, Memorial Sloan Kettering Cancer Center, New York, NY)
- 雑誌: Journal of Molecular Diagnostics
- 発行年: 2015
- Epub日: 2014-12-18
- Article種別: Original Article
- PMID: 25801821
背景
がんゲノムプロファイリングにおけるドライバー遺伝子の変異同定と、それに対応する分子標的薬の開発は、現代の臨床腫瘍学においてプレシジョン・オンコロジーを推進する原動力となっている。Garraway et al. (2013) はゲノム駆動型腫瘍学の治療フレームワークを提唱し、MacConaill et al. (2011) は包括的な臨床ゲノム解析における技術的課題と実装の機会を論じ、Taylor et al. (2011) は臨床がんゲノミクスの現状と将来展望を整理した。また、Romano et al. (2011) はメラノーマにおける分子分類と標的治療の関連を論じ、Chapman et al. (2011) はBRAF V600E変異陽性メラノーマに対するベムラフェニブの生存期間延長効果を報告し、Shaw et al. (2013) はALK融合遺伝子陽性の非小細胞肺がんにおけるクリゾチニブの治療優越性を確立した。しかし、従来の臨床診断で広く用いられてきたアンプリコンPCRベースの次世代シーケンシング (next-generation sequencing: NGS) アッセイには、カバレッジの不均一性、PCR重複による定量精度の低下、コピー数異常や構造異常の検出困難といった技術的限界が存在していた。さらに、従来の商用小規模パネルは標的遺伝子数が50遺伝子以下と極めて狭く、複雑ながんゲノムを包括的に捉えるには不十分であった。最も重大な課題として、ホルマリン固定パラフィン包埋 (formalin-fixed, paraffin-embedded: FFPE) 検体から体細胞変異のみを高感度かつ高精度に同定するためには、患者マッチ正常組織を用いたペア解析が不可欠であるが、これを大規模な臨床検査として統合・実装したシステムは未確立であった。このように、臨床判断の精度向上に必要な体細胞変異、コピー数変異、構造変異を単一アッセイで包括的に同定するための技術やシステムが根本的に不足しており、ゲノム医療の臨床現場において大きなgapが残されていた。したがって、300遺伝子を超える規模で、FFPE検体から高品質なゲノムプロファイリングを可能にするハイブリダイゼーションキャプチャ型臨床アッセイの確立が強く求められていた。
目的
本研究の目的は、固形腫瘍のFFPE検体を対象に、341個の主要ながん関連遺伝子の全エキソンおよび選択的イントロン領域を標的とするハイブリダイゼーションキャプチャ型臨床NGSアッセイ「MSK-IMPACT (Memorial Sloan Kettering-Integrated Mutation Profiling of Actionable Cancer Targets)」を開発し、その分析的妥当性 (感度、特異度、再現性、検出限界) を包括的に検証することである。特に、患者マッチ正常組織とのペア解析を臨床ワークフローに完全統合することで、プライベートな生殖細胞系列バリアントを確実に排除し、体細胞点変異、挿入・欠失 (インデル)、コピー数異常、および構造異常を単一のアッセイで高精度かつ同時に検出するシステムを臨床グレードで確立・実証することを目指した。
結果
カバレッジの均一性と技術的パフォーマンス: 正常FFPE検体10例を二重測定した基準データセット (n=20 replicates) において、全ターゲットエキソンの平均ユニークカバレッジは700x (SD ±182x) を達成した (Fig. 1A)。全カノニカルエキソンの97%において、平均カバレッジの50%以上 (350x以上) のシーケンス深度が確保された。GCコンテントが20%から70%の領域では極めて均一なカバレッジが示されたが (Fig. 1B)、42エキソン (全体の約1%) は高度な配列類似性によるマッピング品質低下、または極端な高GCコンテント (平均80%) のためにカバレッジが低下した。統計的パワー解析により、真の変異頻度が10%のバリアントを98%のパワー (alpha=0.05) で検出するためには100x以上のカバレッジが必要と算出され、実運用における目標平均ユニークカバレッジは200x以上に設定された。
バリアントコールのフィルタリング最適化: 正常レプリケート間の比較により発生した偽陽性コールの解析から、偽陽性を排除するための最適なフィルタリング閾値を決定した。文献的裏付けのある第1層 (first-tier) のホットスポット変異については、カバレッジ深度 20x以上、変異リード数 8リード以上、変異頻度 2%以上を閾値とすることで、偽陽性を完全に排除した (Fig. 2A)。一方、新規変異を含む第2層 (second-tier) の非ホットスポット変異については、カバレッジ深度 20x以上、変異リード数 10リード以上、変異頻度 5%以上を閾値に設定し、41,220件中41,211件の偽陽性を除去して99.9%の偽陽性棄却率を達成した (Fig. 2B)。
臨床検体における変異検出感度と再現性: 既知の体細胞変異を有する284例のFFPE腫瘍検体を用いた検証において、275例 (96.8%) で目標カバレッジの200x以上を達成し、全体の中央値カバレッジは753xであった。MSK-IMPACTは、284例全例 (100%) において既知のバリアント (点変異およびインデル) を正確に検出した。この中には、変異頻度が10%未満の低頻度変異が13件含まれていた。検出された既知SNVの平均カバレッジは912x (SD ±529x)、平均変異頻度は36% (SD ±18%) であり、既知インデルの平均カバレッジは897x (SD ±514x)、平均変異頻度は26% (SD ±15%) であった (Fig. 4)。再現性評価のために、BRAF p.V600E、KRAS p.G12C、EGFR p.L858Rの点変異3サンプル、およびEGFR exon 19欠失、ERBB2 exon 20挿入、KIT exon 11欠失のインデル3サンプルを、異なるバーコードを用いて同一ラン内 (intrarun) および異なるラン間 (interrun) で三重に測定した。その結果、すべてのレプリケートで既知変異が100%検出され、バリアント頻度の標準偏差 (SD) は0.01から0.025と極めて高い再現性が実証された (Table 2)。
患者マッチ正常組織 (matched normal) の臨床的意義: 腫瘍単独解析 (unmatched) と腫瘍・正常ペア解析 (matched) の比較を行った。腫瘍・正常ペア解析を行った場合、検出された体細胞変異は1症例あたり平均6件であったのに対し、マッチする正常組織を用いずに解析した場合は1症例あたり平均15件の変異がコールされた (Fig. 5A)。この差分となる追加コールのうち、平均15件は1000人ゲノムプロジェクトなどのデータベースに登録された一般的な多型であったが、平均9件はデータベースに未登録のプライベートな生殖細胞系列バリアントであった。これらのプライベート生殖細胞系列バリアントの平均変異頻度は48.3%であり、真の体細胞変異の平均変異頻度である28.3%と重なり合っていたため、数値のみで区別することは困難であった (Fig. 5B)。実際の臨床運用における最初の1,000例のうち、955例 (95.5%) において患者マッチ正常組織の取得およびペア解析が可能であり、本アプローチの臨床現場における実用性が示された。
検出限界 (LOD) の評価: 6例のSNV陽性検体と4例のインデル陽性検体を用いた段階的希釈試験により、分析感度の限界を評価した。その結果、ERBB2 p.V777L変異における0.78%の希釈段階、およびその他の変異における3.1%の希釈段階に至るまで、ほぼすべての既知変異が正しく検出された (Fig. 6)。希釈限界において検出を逃れた原因はシーケンス深度の不足ではなく、変異頻度が偽陽性排除のためのバックグラウンド閾値 (2%) を下回ったためであった。
コピー数異常および構造変異の検出: コピー数異常の検証として、FISH (fluorescence in situ hybridization) 法またはリアルタイムqPCR法でERBB2増幅が確認されている19例 (乳がん 8例、胃がん 11例) を解析した。MSK-IMPACTは19例全例 (100%) でERBB2増幅を検出し、乳がんで平均3.4倍、胃がんで平均4.1倍の増幅を同定した (Fig. 7)。また、構造変異の検証として、EML4-ALK転座を有する肺腺がん4例を解析した結果、全例で正確に転座ブレイクポイントが同定され、平均10本のペアエンドリードおよび平均13本のスプリットリードによる技術的サポートが得られた (Fig. 8)。コピー数判定の統計的閾値は、fold change >2.0 (ゲノムコピー数の増加) または ←2.0 (減少)、かつFDR (false discovery rate) 補正後のp<0.05に設定された。
考察/結論
先行研究との違い: 本研究で開発されたMSK-IMPACTは、従来の50遺伝子以下を対象としたアンプリコンPCRベースの商用NGSパネルや、患者マッチ正常組織を用いない腫瘍単独のシーケンスアプローチと異なり、341個のがん関連遺伝子の全エキソン領域をカバーする大規模なハイブリダイゼーションキャプチャ法を採用し、かつ腫瘍・正常ペア解析を臨床検査ワークフローとして完全に統合した点で決定的に異なる。
新規性: 本研究は、FFPE検体から抽出された微量かつ断片化したDNAを用いて、単一のアッセイプラットフォームから、点変異 (SNV)、微小挿入・欠失 (インデル)、遺伝子コピー数異常 (CNV)、および再発性転座などの構造異常 (SV) を、平均700xという極めて高い均一性と深度をもって包括的に検出できる臨床グレードのNGSシステムを世界で初めて新規に確立した。
臨床応用: 本アッセイは、がん患者の個別化医療 (プレシジョン・オンコロジー) の臨床現場における意思決定に直結する高い実用性を持つ。患者マッチ正常組織のペア解析を標準化することで、データベースに存在しないプライベートな生殖細胞系列変異を体細胞変異と誤認することを確実に防ぎ、真の治療標的のみを同定して、最適な分子標的薬の選択や臨床試験へのマッチング精度を飛躍的に向上させるという臨床的有用性を有する。
残された課題: 今後の検討課題として、30 bpを超える中〜大規模なインデルや、FLT3遺伝子などで見られる内部タンデム重複 (internal tandem duplication: ITD) に対する検出力を向上させるため、アセンブリベースのバイオインフォマティクスアルゴリズムを統合することが挙げられる。また、本研究の時点では、CNVおよびSVの包括的な感度・特異度バリデーションは継続中であり、これらを臨床報告基準に完全統合するためのさらなる検証が今後の課題として残されている。
方法
パネル設計とターゲット濃縮: 341遺伝子のカノニカル転写産物4,976エキソン、非カノニカル転写産物104エキソン、および再発性転座に関与する14遺伝子の33イントロン領域、TERT (telomerase reverse transcriptase) プロモーター領域を標的として設計した。さらに、検体識別、DNA汚染検出、およびコピー数解析の補助を目的として、ゲノム全体に均一に分散した1,042箇所のSNP (single nucleotide polymorphism) 領域を標的に追加した。ターゲット濃縮には、NimbleGen SeqCap EZ (Roche NimbleGen社) カスタムオリゴシステムを用い、バイオティン化DNAプローブ (ベイト) を設計した。
ライブラリ調製およびシーケンス: 腫瘍FFPE検体および患者マッチ正常組織 (血液または正常組織) から抽出したゲノムDNAをCovaris E200で剪断した。KAPA HTP (high-throughput protocol) ライブラリ調製キット (Kapa Biosystems社) を用い、末端修復、A-base添加、48種のユニークな6-merバーコードアダプターのライゲーション、およびPCR増幅を自動化システム上で実施した。腫瘍ライブラリと正常ライブラリを3:1の比率でプールし、Illumina HiSeq 2500を用いて2×100 bpのペアエンドシーケンスをrapid-runモードで実施した。
バイオインフォマティクスパイプライン: BCL2FASTQ (v1.8.3) でデマルチプレクスを行い、TrimGaloreおよびCutAdapt (v0.2.5) でアダプター配列をトリミングした。リードのアライメントにはBWA-MEM (v0.7.5a) を用い、ヒト参照ゲノムhg19 (b37) にマッピングした。Picardを用いてPCR重複リードをマークして排除した。GATK (v2.7.2) のIndelRealignerを用いてインデル領域のローカル再アライメントを行い、BaseRecalibratorで塩基クオリティスコアを再調整した。体細胞単一塩基バリアント (single nucleotide variant: SNV) の検出にはMuTect (v1.1.4) を使用し、インデルの検出にはGATK (v2.3.9) のSomaticIndelDetectorを使用した。コピー数変異 (copy number variation: CNV) 解析では、ターゲット領域のシーケンス深度をGCコンテンツでLoess正規化し、腫瘍と正常の比率をCircular Binary Segmentation (CBS) 法でセグメンテーションした。構造変異 (structural variant: SV) の検出には、ペアエンドリードとスプリットリードの両方をサポート情報として用いるDELLY (v0.3.3) を使用した。
統計解析: 統計的手法として、変異検出力を評価するためにcloglogパラメータ化を用いた二項分布に基づくパワー解析 (power analysis) を実施し、特定の変異頻度を検出するために必要なシーケンスカバレッジ深度を算出した (有意水準 alpha=0.05)。また、偽陽性フィルタリングの閾値を決定するために、10例の正常FFPE検体を二重測定したデータ (n=20 replicates) を用いて、レプリケート間でのバリアントコール比較に基づく経験的閾値設定を行った。