• 著者: Hyun-Tae Shin, Yoon-La Choi, Jae Won Yun, Nayoung K.D. Kim, et al.
  • Corresponding author: Peter J. Park (Harvard Medical School, Boston, MA); Woong-Yang Park (Samsung Genome Institute, Samsung Medical Center, Seoul, Korea)
  • 雑誌: Nature Communications
  • 発行年: 2017
  • Epub日: N/A
  • Article種別: Original Article (Translational / Bioinformatics / Methods)
  • PMID: 29123093

背景

精密医療における腫瘍ゲノムプロファイリングでは、NGS (next-generation sequencing) パネルシーケンスによる体細胞変異の正確な検出が不可欠である。VAF (variant allele fraction; 変異アレル頻度) は腫瘍細胞の割合 (腫瘍純度)・腫瘍内クローン多様性・治療後に出現するサブクローナルな耐性変異によって決定される。一方で、臨床検体における低VAF変異の実際の分布は大規模に解析されてこなかった。

先行研究の系譜を整理すると、Gerlinger et al. (2012) や Cancer Genome Atlas は主に外科切除検体 (高腫瘍純度) を用いており、小生検主体の実臨床コホートへの外挿性には限界があった。また、Dawson et al. (2013) は液体生検の可能性を示したが、組織NGSパネルにおける低VAFの臨床的分布は未解明であった。さらに、Garofalo et al. (2016) や Sacher et al. (2016) はhotspot変異の治療反応性を示したものの、それらの変異がどの程度低VAFで出現するかは不明のままであった。

標準的NGS (100-200×) では低VAF変異の検出感度が不足している可能性が示唆されていたが、どの程度の深度が必要かの定量的根拠が欠けていた (knowledge gap)。特にEGFR T790M (threonine-790 methionine mutation) やC797S (cysteine-797 serine substitution) のような治療選択に直結する変異については、低VAF事例の頻度と検出要件を明らかにすることが臨床的に急務であった。何が足りなかったか:すなわち、実臨床コホートで低VAF変異の頻度・検出限界・治療反応性を統合的に評価したデータが不足していた。

目的

CancerSCAN (clinical cancer sequence analysis NGS) を用いた5,095例の臨床癌検体NGS (381遺伝子カスタムパネル;平均約900×) データにより、主要hotspot変異 (EGFR・KRAS・PIK3CA・BRAF) のVAF分布を系統的に解析すること。低VAF変異の臨床的意義を実際の治療奏効例で示し、現行の臨床アッセイ (FISH・IHC) と同等の感度・特異度を達成するために必要なシーケンス深度を定量的に決定すること。また、腫瘍純度・FFPE (formalin-fixed paraffin-embedded; ホルマリン固定パラフィン包埋) 等の検体特性が低VAF検出に及ぼす影響を評価すること。

結果

主要hotspot変異における低VAF変異の高頻度 — EGFR T790Mの24%がVAF<5%: 5,095例の20 hotspot変異解析で、VAF<10%の割合はEGFR 28%・KRAS 21%・PIK3CA 26%・BRAF 17%であった。VAF<5%の割合はEGFR 16%・KRAS 11%・PIK3CA 12%・BRAF 10%と、全てのhotspot遺伝子で10%前後が低VAFで存在した。個別hotspotでは、EGFR T790M (n=113例) のうちVAF<5%が 24% (28例) と最も高い低VAF頻度を示した。PIK3CA E545 (exon 545 substitution variant) は17%がVAF<5%。KRAS G12 (glycine codon 12 variant) は12%がVAF<5%。これらの低VAF変異は主に、腫瘍純度の低い生検検体 (histological tumor purity ≤20%が30%、≤40%が51% in 3,600例の肺生検コホート) および治療後の獲得耐性変異を含む検体に由来すると推定された。ddPCR検証では、シーケンス推定VAFとdPCR測定VAFの間でPearson r=0.86の高い相関が確認され (59変異)、低VAFにおいてもCancerSCANの定量的正確性が裏付けられた (Figure 2a)。

EGFR C797S (osimertinib耐性変異) のサブクローナル出現と極低VAF検出: 8例の肺癌患者でEGFR C797S変異を検出 (Fig 2b-e)。C797SのVAFはEGFR活性化変異やT790Mより顕著に低く、4例がVAF 1.4%・2.2%・3.9%・4.0% という極低頻度であった。全8例でC797SはT790Mと同一アリルに (cis) 検出された。連続採血の1例では、C797S変異がAZD9291 (anticancer agent zenithal drug 9291; osimertinib) 治療前検体では未検出・治療後検体で検出され、osimertinib獲得耐性として出現するサブクローナル変異の実臨床例を初めて系統的に示した。

EGFR TKI治療後のT790M VAF低下 — サブクローナル耐性進化パターン: 肺癌141例をEGFR TKI前 (n=31例) とTKI後 (n=110例) に分類して比較。TKI後群でhotspot変異のVAF分布が有意に低く (P=0.018)、主にEGFR T790MのVAF低下による (TKI前:T790M中央値高VAF群が優位、TKI後:低VAF群に偏移)。これはTKI後の残存T790M保有クローンが選択されたが全体としてはサブクローナルな状態にあるという耐性進化パターンを反映する。全サンプルのVAF分布を前後で比較すると有意差は認めなかった (P値非有意) が、TKI特異的なサブグループでは明確な差が示された。

感度分析 — LODとシーケンス深度の定量的関係: in silico希釈解析により (Fig 3)、95%感度で変異を検出するために必要な深度はVAFに強く依存する。VAF 20%: 40×、VAF 10%: 94×、VAF 5%: 294×、VAF 2%: 1,085× を要した。EGFR T790M実検体のサブサンプリング (n=72 samples) では、200×での検出率84%・100×での検出率74%・50×での検出率62%であり、標準的WES (100-200×) では本変異の15-30%が見逃される可能性が示された。これは通常のNGSパネルの深度設計とLOD明示の重要性を示し、シーケンス深度だけでなくLODをhotspot・ヌクレオチドレベルで明示することが臨床報告に必要と提言された。

腫瘍純度の臨床実態 — 生検検体の51%が純度≤40%: CancerSCANの約半数の症例でcomputational tumor purity estimateが可能であった (Fig 4)。同院の3,600例肺生検コホートでは組織学的腫瘍純度≤20%が30%・≤40%が51%と、TCGA検体 (手術切除主体) と比較して著明に低かった。この低純度が低VAF変異の主因の一つであり、臨床的small biopsyに最適化された変異コール手法の必要性が強調された。

低VAF変異でも標的療法奏効 — EGFR T790M 3.5%でAZD9291部分奏効: (1) 59歳女性 NSCLC・多発遠隔転移例:骨・肝転移再発後にCancerSCANでEGFR L858R (leucine-858 arginine substitution; 29%)・T790M (3.5%) を検出し、AZD9291試験に登録して部分奏効 (PR) を達成。(2) 70歳女性・転移性胃癌例:capecitabine/oxaliplatin化学療法8サイクル後にPIK3CA E542K (exon 542 lysine variant; VAF 4.1%) を検出 (ddPCRで確認)、AKT (activated target kinase) 阻害薬投与で部分奏効。また、EGFR T790M低VAF (≤5%) vs 高VAF (>5%) 患者 (n=65 patients) の第3世代EGFR TKI (tyrosine kinase inhibitor) 治療下でのPFS Kaplan-Meier曲線は有意差を示さず、低VAF変異でも治療効果が同等であることが示された。

5,095例の全actionable変異頻度プロファイル — 44%にtier 1変異を検出: 5,095例でKRAS (13%)・EGFR (9.5%)・PIK3CA (9.4%)・HER2/ERBB2 (erythroblastic receptor binding type; 7.5%) が最頻変異。全変異の62%がSNV/indel・34%がCNV・4%がgene fusionで、44%の患者でactionable変異が検出された。TCGA (The Cancer Genome Atlas) 等の既存データセットとは異なり、本コホートは多癌種かつ実臨床生検を含む点でより実践的である。

考察/結論

本研究は5,095例という類例のない規模の臨床コホートにより、臨床的に重要なhotspot変異 (特にEGFR T790M・C797S) が相当な割合 (T790M 24%・PIK3CA E545 17%・KRAS G12 12%) でVAF<5%という低頻度で出現することを初めて系統的に示した。標準的な100-200×のWESでは15-30%を見逃す計算となり、臨床において偽陰性が患者の治療機会を失わせうることを実データで実証した。

先行研究との比較: 既存のTCGA等の変異頻度情報は外科切除検体 (高腫瘍純度) に基づいており、これらの先行研究と異なり、本研究は実臨床の小生検・FFPE検体を主体とした大規模コホートで低VAF変異の実態を定量した点で独自性がある。Sacher et al. 2016等の標的療法試験は変異の検出可能性を前提としていたが、本研究は「検出困難な低VAF変異でも治療反応性がある」という先行研究の想定と異なる実エビデンスを提供した。C797SのVAFがT790Mより顕著に低い (サブクローナル耐性として後から出現) という特性の実臨床データによる実証も、先行研究 (Thress et al. 2015) のin vitro知見と異なり実臨床規模で示された初の報告である。

新規性: 本研究で初めて実臨床コホート (5,095例) 規模での低VAF変異の系統的頻度解析が行われ、定量的なLOD深度カーブおよびFFPE検体での実効カバレッジ低下が明示された。これまでにない大規模実臨床データによりシーケンス深度とLODの関係が定量化され、液体生検・高感度検出技術 および Bettegowda et al. SciTranslMed 2014 が示した循環腫瘍DNA (ctDNA) 解析の臨床導入への定量的根拠を提供した。

臨床的含意: EGFR-T790M (epidermal growth factor receptor T790M variant) 耐性 および EGFR-C797S (epidermal growth factor receptor C797S variant) 耐性 の検出を目的とする場合、hotspot領域では平均1,000×以上の高深度シーケンスが必要という本研究の定量的根拠は、ddPCR・超高感度液体生検の臨床導入の根拠の一部となった。本論文はまた、シーケンス深度だけでなくLODを位置ごとに報告書に明示するという新たな臨床シーケンシング報告様式を提唱した点でも革新的である。アジア人肺癌ではEGFR変異陽性が40-50%を占め、TKI耐性時にT790Mを検索する診療フローが確立しており、本研究のような「低VAF変異の見落とし防止」という実用的課題への大規模証拠提示は KRAS-co (kinase ras codon landscape context) 腫瘍変異景観 解析の精度向上にも貢献する。

限界と今後の課題: 残された課題として、本研究はhotspot変異に焦点を当てており、非hotspot部位での低VAF変異の偽陽性評価は別途必要。腫瘍純度のcomputational推定は約半数の症例にしか適用できず、特に低純度検体ではさらなる手法の改善が必要。FFPE特有のデアミナーゼ損傷変異 (C>T変異) との区別は高度なフィルタリングを要する。今後の検討として、固形腫瘍での液体生検 (cfDNA) との統合、機械学習を用いた低VAF偽陽性除去、および各変異位置特異的LODの標準化が課題として残る。

方法

対象と解析基盤: Samsung Medical Center (3年間、2014年1月〜2016年8月) でCancerSCAN sequencingを施行した5,095例。多数の癌種を含み、約半数がFFPE検体・約半数が再発/転移歴のある難治例。CancerSCAN バージョン1 (83遺伝子、1,497例) およびバージョン2 (381遺伝子、3,598例) を使用。

シーケンシング: カスタムSureSelect (sequence target enrichment selection) captureを用いてHiSeq (high-throughput sequencing platform) 2500で100-bpペアエンドシーケンス。全体の平均カバレッジ約900×、hotspot部位はさらに高深度 (平均1,151×)。約半数のFFPE検体では除去後の実効カバレッジ約800×。

変異コールと精度向上: MuTect (mutation detection algorithm v1.1.4) とLoFreq (low-frequency variant caller v0.6.1) の組み合わせ + 正常サンプルパネル (400例以上の正常組織) によるgermline filtering。追加としてlogistic regressionモデルによる低VAF特異的フィルタリングステップを実装し、偽陽性を大幅削減。SNV・indel (Pindel)・CNV・gene fusionを統合検出。統計解析: Pearson相関係数 (ddPCR vs NGS VAF)、paired t-testおよびWilcoxon rank sum test (VAF分布比較)、Kaplan-Meier法 + log-rank test (PFS比較)。

Validation: 59例の低VAF変異 (VAF 2.5-10.3%) についてddPCR (digital droplet PCR; デジタルドロップレットPCR) でVAF推定を検証 (Pearson r=0.86)。

LOD (limit of detection; 検出限界) 定量: HapMap (haplotype map reference genome database) のNA12878 (normal reference genome cell) のin silico希釈 (VAFを操作してsensitivity-specificityを測定) と、実臨床データのサブサンプリングによるLOD推定の2手法。

臨床的意義評価: 低VAF変異で治療を選択した患者 (n=2 patients) の奏効確認。EGFR T790M低VAF vs 高VAF患者 (n=65 patients) の第3世代TKI (tyrosine kinase inhibitor) treatment下でのPFS比較。