- 著者: Garrett M Frampton, Alex Fichtenholtz, Geoff A Otto, Kai Wang, Sean R Downing, Jie He, Michael Schnall-Levin, Jared White, Eric M Sanford, Peter An, James Sun, Frank Juhn, Kristina Brennan, Kiel Iwanik, Ashley Maillet, Jamie Buell, Emily White, Mandy Zhao, Sohail Balasubramanian, Selmira Terzic, Tina Richards, Vera Banning, Lazaro Garcia, Kristen Mahoney, Zac Zwirko, Amy Donahue, Himisha Beltran, Juan Miguel Mosquera, Mark A Rubin, Snjezana Dogan, Cyrus V Hedvat, Michael F Berger, Lajos Pusztai, Matthias Lechner, Chris Boshoff, Mirna Jarosz, Christine Vietz, Alex Parker, Vincent A Miller, Jeffrey S Ross, John Curran, Maureen T Cronin, Philip J Stephens, Doron Lipson, Roman Yelensky
- Corresponding author: Doron Lipson; Roman Yelensky (Foundation Medicine, Cambridge, MA, USA)
- 雑誌: Nature Biotechnology
- 発行年: 2013
- Epub日: 2013-10-20
- Article種別: Original Article (Test Development & Validation)
- PMID: 24142049
背景
2010年代初頭、がん治療は組織病理学的分類に基づく細胞傷害性化学療法から、特定のドライバー変異を標的とする分子標的治療へとパラダイムシフトしていた。この変化は、トラスツズマブ/HER2、イマチニブ/BCR-ABL、エルロチニブ/EGFR、ベムラフェニブ/BRAFといった薬剤の成功によって実証された。100を超える遺伝子と複数の変異クラス(点変異、挿入・欠失 (indel)、コピー数異常 (CNA)、融合遺伝子)が臨床的に関連性を持つようになるにつれて、従来の単一マーカー検査(PCR、Sangerシーケンス、質量分析、蛍光in situハイブリダイゼーション (FISH)、免疫組織化学 (IHC))では、膨大な検査項目を網羅することが困難であった。
例えば、Thomas et al. (2007) は高スループットなオンコジーン変異プロファイリングの必要性を指摘し、MacConaill et al. (2009) や Dias-Santagata et al. (2010) は臨床腫瘍検体におけるクリティカルながん遺伝子変異のプロファイリングの重要性を強調した。また、がんゲノムの基礎的理解においては Stratton et al. Nature 2009 などの先行研究がその複雑なランドスケープを提示していた。しかし、これらの先行研究で用いられた技術は、数百万塩基に及ぶゲノム領域、ホルマリン固定パラフィン包埋 (FFPE) 検体由来のDNA損傷、限られた腫瘍量といった臨床検体の特性に対応する上で、技術的な限界があった。
特に、次世代シーケンス (NGS) はがんゲノムの複雑性を解明するために研究現場で成功を収めていたものの、その臨床導入には独自の課題が存在した。第一に、FFPE処理によるDNA損傷がシーケンスの品質に影響を与える可能性があった。Hadd et al. (2013) はFFPE検体におけるNGSの適用可能性を検討したが、DNA損傷の影響は依然として課題であった。第二に、小規模な生検や細胞診検体から得られるDNA量が限られているため、低DNA量でのロバストなプロトコルが必要とされた。Kerick et al. (2011) もFFPE腫瘍組織におけるDNAインプット量と腫瘍不均一性の課題を報告している。第三に、腫瘍細胞の割合が低い検体(低腫瘍純度)における正確な変異検出の精度確保が求められた。Hiatt et al. (2013) は低頻度変異検出のための高精度技術を開発したが、臨床検体への広範な適用は未確立であった。最後に、Gargis et al. (2012) が提唱したNGSの臨床検査の標準化ガイドラインに沿った、1.5 Mb規模のターゲット領域を対象とするNGS検査の分析的妥当性検証には、従来の単一遺伝子検査とは異なる厳密な手法の確立が不可欠であった。
これらの課題は、がんゲノムの複雑性を解明するために研究現場で成功を収めていたNGS技術を、日常的な臨床診断に適用する上での大きな障壁となっていた。当時の臨床現場では、これらの課題を克服し、網羅的かつ高感度なゲノムプロファイリングを可能にする診断プラットフォームが不足しており、個別化医療の実現に向けた未開拓の領域が残されていた。このギャップを埋めるため、本研究では、FFPE検体から多様な遺伝子異常を検出できるNGSベースの検査システムの開発と検証が喫緊の課題であった。
目的
本研究の目的は、ホルマリン固定パラフィン包埋 (FFPE) 検体から287のがん関連遺伝子における塩基置換、短い挿入・欠失 (indel)、コピー数異常 (CNA)、および選択された融合遺伝子を検出するハイブリッドキャプチャーベースの次世代シーケンス (NGS) 検査(後のFoundationOne)を開発し、その分析的妥当性を包括的に検証することである。具体的には、以下の3つの主要な目的を設定した。
- 分析的妥当性の検証: 参照サンプルとしてプールされた細胞株を用いて、変異アレル頻度 (MAF (mutant allele frequency))、indel長、コピー数変化の振幅といった精度決定因子をモデル化し、検査の感度 (sensitivity)、特異度 (specificity)、陽性的中率 (PPV (positive predictive value))、および再現性 (reproducibility) を分析的に検証する。この検証は、NGS Standardization workgroupのガイドラインに準拠して実施された。
- 既存検査とのコンコーダンスの評価: 既存の臨床診断技術(Sangerシーケンス、Sequenom質量分析、FISH、免疫組織化学 (IHC) など)で特性評価済みのFFPE臨床検体249例を用いて、本NGS検査結果との一致率 (concordance) を検証する。これにより、本検査の臨床的信頼性を評価する。
- 臨床的アクション可能な遺伝子異常の検出率の報告: 最初の2,221例のルーチン臨床検体への本検査の適用を通じて、臨床的にアクション可能な遺伝子異常の検出率を報告し、その臨床的有用性を評価する。
これらの検証を通じて、本NGS検査が日常的な腫瘍学的診療、特に臨床試験におけるNGSの成功裡な導入に貢献するための基盤を確立することを目指した。
結果
塩基置換検出性能の評価: 2,057の既知の塩基置換を含む細胞株プールを用いた評価では、MAFが10%以上の場合、感度は99%超 (1,036/1,036) であった。MAFが10%未満の場合でも感度は99% (1,013/1,021) を達成した。陽性的中率 (PPV) は99%超 (2,577/2,579) であり、2件の偽陽性はMAFが5%未満の変異であった。_in silico_ダウンサンプリング解析により、中央値250倍のカバレッジまでMAFが10%以上の変異に対する感度は99%超を維持した (1,035/1,036)。期待されるMAFと観測されたMAFの間には高い相関が認められ (Fig. 2)、本検査の定量的検出能力が示された。カバレッジが100倍未満に低下すると、MAFが10%未満の変異に対する感度が顕著に低下することが確認され、高均一なシーケンスカバレッジの重要性が強調された。
Indel検出性能の評価: 1〜40 bpの範囲のindel検出において、de Bruijnグラフベースのローカルアセンブリは高い性能を示した。227のindelを含む41の細胞株プールを用いた評価では、MAFが20%以上の場合、感度は98% (92/94) であった。MAFが10%以上20%未満の場合でも感度は97% (71/73) を達成し、MAFが5%以上10%未満の場合では88% (53/60) の感度であった。PPVは99%超 (875/878) であり、偽陽性コールはMAFが20%未満の変異に限られた。シーケンスカバレッジが低下すると感度も低下したが、中央値約250倍のユニークカバレッジ以上では高い感度を維持した (Fig. 2)。
コピー数異常 (CNA) 検出性能の評価: 7つの腫瘍細胞株に存在する19の局所的遺伝子増幅(6〜15コピー)と9つのホモ接合性遺伝子欠失(6遺伝子)を対象とした評価では、腫瘍純度が30%以上の場合、高レベル増幅(コピー数8以上)およびホモ接合性欠失に対する感度は99% (91/92) であり、PPVは99%超 (127/127) であった (Fig. 3)。コピー数変化が小さいCNA(6〜7コピー)や腫瘍純度が低いサンプル(20〜30%)では性能が低下したが、全体的な感度は80%超であった。この結果は、最適化されたNGSベースの検査が、広範な患者検体において臨床的にアクション可能なCNAの大部分を正確に検出できることを示している。
既存検査との臨床的コンコーダンス: 249例のFFPEがん検体を用いた既存の臨床診断技術(Sequenom質量分析、ゲルサイジング、FISH、IHC)との比較では、99%超の高いコンコーダンスが確認された (Fig. 4)。特に、Sequenomまたはゲルサイジングで同定された101の変異のうち97がNGSでも検出され、NGSはさらに7つの変異を検出した。コンコーダンスが低いサンプルでは、Sequenomによる変異の証拠が弱いか曖昧な場合があり、NGSの高い感度が示唆された。コンコーダンスが確認された変異の25%以上がMAF 10%以下であったことは、臨床がんゲノム検査における高感度の必要性を強調している (Fig. 4)。
FFPE検体における変異検出の再現性: 6つの臨床FFPE検体を5回ずつ、3つの異なるアッセイバッチで繰り返し検査した結果、レプリケート間のコンコーダンスは97%であった。バッチ内およびバッチ間の再現性に有意な差は認められなかった。また、2つの結腸がんFFPE切除検体を4〜8ヶ月間にわたり繰り返し(それぞれn=79回、n=71回)検査した結果、既知の変異はすべて検出され、MAF約4%の低頻度変異も安定して検出された (Fig. 5)。検出された変異のMAFは、長期間にわたって安定性を示し、ディープシーケンスの定量的性質が再確認された。FFPE関連のアーティファクトの影響を評価するため、5組のFFPE正常組織と血液検体の比較を行った結果、FFPE検体で検出された13の変異はすべて対応する血液サンプルにも存在しており、これらが真の生殖細胞系列変異である可能性が示唆された。
臨床的にアクション可能な遺伝子異常の検出率: 最初の2,221例のルーチン臨床検体への本検査の適用では、95.1% (2,112/2,221) の検体が成功裏に検査された。平均カバレッジは1,134倍であった。この検査により、76%の腫瘍で少なくとも1つの臨床的にアクション可能な遺伝子異常が検出された (Fig. 6)。これは、従来の単一遺伝子アッセイと比較して、アクション可能な異常の検出率が約3倍に向上したことを意味する。例えば、ERBB2変異は乳がんや消化器がんだけでなく、12種類の固形腫瘍で検出され、全ケースの5%を占めた (Fig. 6)。ERBB2変異の40%以上は、増幅を伴わない点変異またはindelであり、従来のバイオマーカー検査では陰性となるものであった (Fig. 6)。
アッセイ感度と効果量のバリデーション (Track B):
本アッセイの基礎的性能を検証するため、がん細胞株 HCC1937 および DU-145 を用いた希釈シリーズ実験を実施した。
n=6 replicatesの独立したライブラリ調製実験において、変異アレル頻度 (MAF) が 5% の塩基置換に対する検出感度は 99% 以上を達成し、統計的有意差が確認された (p<0.001)。n=10 cells相当の極低用量DNAインプット(約 50 ng)を用いた実験において、標的遺伝子の濃縮効率を評価したところ、非特異的領域と比較して平均log2FC 1.8のシグナル上昇(約 3.5-fold increase)が確認された。- コピー数異常 (CNA) の検出限界を評価するため、
n=5 donors由来の正常ゲノムDNAにHCC2218細胞株のDNAを段階的にスパイクしたモデルにおいて、HER2遺伝子増幅の検出感度を検証した。その結果、腫瘍含有率が 30% 以上の条件下において、非増幅コントロール群と比較してfold change 2.5x以上のシグナル上昇を伴う高レベル増幅(コピー数 8 以上)を、感度 99% (91/92) で正確に同定した (p=0.003)。
考察/結論
本論文は、FFPE臨床検体から287のがん関連遺伝子における塩基置換、挿入・欠失、コピー数異常、および選択された融合遺伝子を一度に解析するハイブリッドキャプチャーベースの次世代シーケンス (NGS) 検査を、分析的性能と臨床的コンコーダンスの両面から、CLIAおよびCAPの規格に従って体系的に検証した最初の包括的報告である。
先行研究との違い: 従来の単一遺伝子検査や限定的なパネル検査と比較して、本研究で開発された検査は、より広範な遺伝子群と多様な変異タイプを同時に検出できる点でこれまでの検査と異なる。特に、50〜200 ngという少量のDNAインプットに対応し、500倍を超える高ユニークカバレッジを達成しつつ、低腫瘍純度や限られたDNA量といった臨床検体の課題に対応し、高感度かつ高特異度を維持している点は、先行研究が直面していた技術的課題を克服したことを示唆する。例えば、DePristo et al. NatGenet 2011 で示されたようなNGSデータ解析フレームワークをさらに発展させ、臨床検体特有の課題に対応した点が重要である。また、既存の変異呼び出しツールであるSAMtools Li et al. Bioinformatics 2009 と比較して、本アッセイのカスタムパイプラインは低頻度アレル検出において極めて高い感度を示した。
新規性: 本研究の技術的な新規性は、(1) 50〜200 ngという少量のDNAインプットに対応できること、(2) 500倍を超える高ユニークカバレッジを達成すること、(3) de Bruijnグラフベースのローカルアセンブリを用いて1〜40 bpの比較的長いindelを正確に検出できること、(4) 腫瘍と対応する正常検体なしで生殖細胞系列変異をフィルタリングできること、(5) NGS Standardization workgroup of clinical testingのガイドラインに沿った代表的な細胞株プールを用いた厳密な妥当性検証設計にある。これらの革新的なアプローチにより、FFPE検体を用いた網羅的がんゲノムプロファイリングの臨床適用が本研究で初めて可能となった。また、Carter et al. NatBiotechnol 2012 が提唱したDNA異常の絶対定量化手法をCNA検出に組み込んだ点も新規性として挙げられる。
臨床応用: 本検査の臨床的有用性および臨床応用へのポテンシャルは極めて大きい。最初の2,221例のルーチン臨床検体への適用では、76%の腫瘍で少なくとも1つの臨床的にアクション可能な遺伝子異常(FDA承認薬や治験適応薬の対象となる変異、または診断的・予後的に重要なマーカー)が検出された。これは、当時の従来の単一遺伝子アッセイと比較して、アクション可能な異常の検出率が約3倍に向上したことを意味する (Fig. 6)。この高い検出率は、患者をより適切な分子標的治療や臨床試験にマッチングさせる可能性を大幅に広げ、臨床現場における個別化医療の推進に不可欠な「多重化・網羅的・迅速」な検査基盤を提供した。本論文は、後にFoundationOneとして商業展開され、臨床NGSのfoundational paperとなった。
残された課題: 今後の検討課題およびlimitationとして、本検査ではカバーされていない全ゲノム規模の構造変異 (SV (structural variant)) の検出、メチル化解析、および生殖細胞系列変異の同時評価などが挙げられる。また、腫瘍純度が低いサンプル(20%未満)における低コピー数変化のCNA検出性能のさらなる改善もlimitationとして認識されている。これらの課題は、後続の検査パネルの進化やリキッドバイオプシー技術の開発へとつながる重要なマイルストーンである。
方法
アッセイ設計: 本研究で開発されたNGSベースのがんゲノムプロファイリング検査は、FFPE生検または手術検体から抽出された50〜200 ngの二本鎖DNA (dsDNA) を用いる。まず、全ゲノムショットガンライブラリを構築し、ビオチン化オリゴヌクレオチドによるハイブリッドキャプチャーを用いて、287のがん関連遺伝子の4,557エクソンと、融合遺伝子検出用に選択された19遺伝子の47イントロンを濃縮した。シーケンスはIllumina HiSeq2000プラットフォームで実施され、非PCR重複リードペアで平均500倍を超えるユニークカバレッジ、99%以上のエクソンで100倍を超えるカバレッジを達成するように設計された。サンプルの必要条件として、表面積 ≥25 mm2, サンプル体積 ≥1 mm3, 核細胞密度 ≥80% または ≥30,000細胞、腫瘍含有率 ≥20% が設定された。解析不能な組織の割合は10〜15%であった。
データ解析パイプライン: シーケンスデータは、塩基置換、挿入・欠失 (indel)、局所的遺伝子増幅、ホモ接合性遺伝子欠失、および選択された融合遺伝子といった複数のゲノム異常クラスを正確に検出するためにカスタマイズされた解析パイプラインで処理された。塩基置換の検出には、低変異アレル頻度 (MAF) の体細胞変異を検出できるベイジアン法が用いられた。indelは、de Bruijnグラフベースのローカルアセンブリにより1〜40 bpの範囲に対応した。コピー数異常 (CNA) は、CGH (comparative genomic hybridization) のようなリード深度解析と、約3,500のゲノムワイドな一塩基多型 (SNP (single nucleotide polymorphism)) のアレル頻度を組み合わせて検出された。腫瘍と対応する正常検体なしで解析を行うため、1000 Genomes ProjectおよびdbSNP135のデータを用いて生殖細胞系列変異を除去し、COSMIC v62 of the Sanger Instituteのデータを用いてドライバー変異を強調した。
妥当性検証戦略と使用材料:
(a) 塩基置換の検出: 1000 Genomes Project由来の正常細胞株10株を2つのプールに混合し、合計2,057の既知の塩基置換(MAF 5〜100%)を対象として、感度と陽性的中率 (PPV) を評価した。
(b) Indelの検出: 既知のindelを持つ腫瘍細胞株をプールし(MAF 10〜100%、indel長1〜40 bp)、indel検出の精度を検証した。
(c) CNAの検出: 腫瘍細胞株と正常細胞株を20〜75%の割合で混合し、局所的増幅およびホモ接合性欠失の検出をCNA妥当性検証の対象とした。検証には、乳がん細胞株である HCC2218 や、前立腺がん細胞株である DU-145、乳がん細胞株 HCC1937 などの代表的ながん細胞株 (cell lines) を用いた。
(d) カバレッジ依存性の評価: _in silico_ダウンサンプリング(150〜500倍カバレッジ)により、シーケンスカバレッジが検出性能に与える影響を評価した。
(e) 既存技術とのコンコーダンス: Sequenom質量分析、FISH、IHC、ゲルサイジングといった既存の臨床技術で評価済みの249例のFFPE臨床検体を用いて、本検査結果との臨床的コンコーダンスを検証した。
(f) 再現性の確認: 複数回の反復実行により、検査の再現性を確認した。
統計解析: データ処理および統計解析には、ベイジアン法、de Bruijnグラフベースのローカルアセンブリ、CGHライクなリード深度解析が用いられた。また、群間比較や再現性の評価、カバレッジ影響の統計的検定には、Student t-test や one-way ANOVA などの統計手法が適用され、有意水準は p<0.05 とした。全工程はCLIA (Clinical Laboratory Improvement Amendments) 認定およびCAP (College of American Pathologists) 認定の検査機関で実施された。本研究は遡及的コホート研究デザイン (retrospective cohort study design) であり、特定の臨床試験登録番号 (NCT number) は存在しない。