• 著者: Lee W, Jiang Z, Liu J, Haverty PM, Guan Y, Stinson J, et al.
  • Corresponding author: Zemin Zhang (Genentech); Somasekar Seshagiri (Genentech)
  • 雑誌: Nature
  • 発行年: 2010
  • Epub日: N/A
  • Article種別: Original Article
  • PMID: 20505728

背景

肺癌 (特に非小細胞肺癌) は世界の癌死の主要原因であり、喫煙関連肺癌が最も一般的な型である。本研究以前の体細胞変異探索は、EGFR・KRAS・TP53 などの限定された遺伝子セットを Sanger シークエンシングで標的解析する手法に依拠しており (Ding et al. Nature 2008)、腫瘍ゲノム全体の変異スペクトラム (SNV 数・置換タイプ分布・構造変異・コピー数変化の同時把握) はまったく不明であった。次世代シークエンシングを用いた全がんゲノム解析は急性骨髄性白血病 (Ley et al. Nature 2008)、小細胞肺癌 cell line (Pleasance et al. Nature 2010)、乳癌に先行して報告されていたが (Stratton et al. Nature 2009 が概念的フレームワークを提示)、固形腫瘍 (特に primary 肺腺癌) と対応正常組織の同時 WGS による包括解析は未報告であった。これまでに足りなかったのは、(a) primary 固形腫瘍と matched normal の同時全ゲノムシークエンシング (whole genome sequencing, WGS) データ、(b) 50,000 規模の体細胞 SNV カタログを mass-spec validation で品質保証する大規模技術検証、(c) 発現遺伝子 vs 非発現遺伝子・プロモーター vs 全ゲノムという機能的領域別の selection pressure を定量化する解析枠組みの 3 点で、これらの gap を埋める研究が課題として残されていた。

目的

喫煙歴を持つ 51 歳男性患者の肺腺癌 (60× カバレッジ) と対応正常組織 (46× カバレッジ) の完全ゲノム配列を比較することで、ゲノムワイドな体細胞変異スペクトラム (SNV・構造変異・コピー数変化) を包括的に解析し、変異率・変異パターン・選択圧・経路レベルの変異の多重性を初めて明らかにすること。

結果

所見1: ゲノムカバレッジと体細胞 SNV カタログの構築 (n=50,675 高信頼度変異):腫瘍ゲノムの 99.2%・正常ゲノムの 99.4% がカバーされた (Table 1)。腫瘍サンプル n=2,720,041 個の SNV (正常 n=2,952,347 に対して) が検出され、フィルタリング後 n=83,000 個以上の体細胞 SNV 候補が同定された。スコア閾値で 90% precision・82% sensitivity を担保した n=50,675 個の高信頼度体細胞 SNV を最終解析対象とした (Supplementary Table 5)。MassARRAY 独立検証では n=530 SNV のうち 70% が真の体細胞変異として確認され、コーディング領域では 302/418 (72%) の非同義変異と 90/143 (63%) の同義変異が検証され、p=0.001 未満の有意水準で品質保証された (Fig. 1)。腫瘍は正常に対し SNV 数が 0.92-fold とほぼ同等であり、体細胞変異の影響は per-Mb mutation rate の上昇として現れた。

所見2: ゲノムワイド変異率 17.7 mut/Mb と コーディング領域 12.5 mut/Mb の機能的選択圧:50,675 個の高信頼度体細胞 SNV からゲノムワイド変異率は 17.7 mutations per megabase (Mb) と算定された。コーディングエクソンの変異率 12.5 mut/Mb はゲノム平均より有意に低く (p=7×10⁻¹³)、purifying selection の存在を示した。先行する 188 lung tumour の 623 gene panel 解析 (Ding et al. Nature 2008) では smoker で最大 49 mutations が報告されていたが、本サンプルではその同一遺伝子セットで 17 mutations を検出し、既存範囲内に収まることを確認した。

所見3: 喫煙関連 G→T 変異シグネチャー (46% で生殖細胞系列の 4 倍):体細胞変異の 78% が GC 塩基対に生じており、G→T transversion が全体の 46% を占めた (Fig. 2a)。一方、生殖細胞変異では A→G/G→A transition が 69% を占めており、明確に対照的なパターンを示した。これは喫煙関連 DNA 損傷 (ベンゾ[a]ピレンによる G 付加体) に特徴的な signature であり、小細胞肺癌 cell line (Pleasance 2010) で報告された pattern と一致した。G→T 変換は GpA/TpC ジヌクレオチド context で特に濃縮されており (G→T 後に A が 52%、p<1×10⁻¹⁶、chi-squared test)、多くの癌種で観察されるこの dinucleotide preference は生殖細胞には見られなかった (Supplementary Fig. 9)。

所見4: 発現遺伝子の変異率は非発現の半分以下 (8.3 vs 17.5 mut/Mb)、Ka/Ks 0.81 vs 1.26:腫瘍で発現している遺伝子の変異率は 8.3 mut/Mb (イントロン・UTR を含む) で、非発現遺伝子 17.5 mut/Mb の約半分であった (p<1×10⁻¹⁶) (Fig. 2b)。転写鎖は非転写鎖より変異率が低く (発現遺伝子で strand bias がより顕著)、transcription-coupled DNA repair (TCR) の影響と整合した。発現遺伝子の Ka/Ks 比は 0.81、非発現遺伝子は 1.26 で、発現遺伝子では protein-altering 変異への purifying selection が示唆された。一方キナーゼ遺伝子では非同義 10 / 同義 1 で Ka/Ks が高く、positive selection (driver 候補) が示唆された。プロモーター領域 (転写開始点から 2 kb 以内) も 10.5 mut/Mb と全ゲノム平均より 40% 低く (p<1×10⁻¹⁶、Fisher’s exact test、Fig. 2c)、GC 含量補正後も有意に低かった。

所見5: 43 体細胞構造変異の検証と 15q21 inversion・4q-9p translocation の FISH 確認:mate-paired sequence library から 344 構造変異候補を同定し、79 を体細胞候補として選別、65 例を PCR 検証して 43 例 (66%) が体細胞変異と確認された (Supplementary Table 4)。43 のうち 27 例は少なくとも一端が遺伝子領域にマッピングされた。FISH 検証では染色体 15q21.1-15q21.3 の大型 inversion (~12 Mb、B2M と TCF12 遺伝子間、腫瘍細胞の 40% に存在) と 4q32.1-9p13.2 間の interchromosomal translocation (腫瘍細胞の 67% に存在) を確認した。多くの breakpoint がコピー数変化境界の近傍にマップされ、構造変異とコピー数変化の連関を示した (Fig. 1)。

所見6: EGFR-RAS-RAF-MEK-ERK 経路の 8 遺伝子多重変異 (KRAS G12C 点変異 + 増幅 + EGFR 増幅 + SHC1/GRB2/SOS/ARAF/MAP3K3/ELK1 増幅):この腫瘍は MAPK 経路内に少なくとも 8 遺伝子にわたる活性化変化を持っていた (Fig. 3)。KRAS の G12C 点変異 (本サンプルで唯一の既知 driver 変異)、KRAS と EGFR のコピー数増幅、SHC1・GRB2・SOS・ARAF・MAP3K3・ELK1 の high-level 増幅が同時に検出された。さらに p38 経路では MKK6・p38 自身の増幅、DUSP22 (negative regulator) の点変異、NFKBIA (NFκB の抑制因子) の inactivating 変異が重なり、CDK4 転写の多重 positive regulation が示された (Fig. 3)。これは「oncogene addiction」モデルに対する複雑性の追加を意味し、partially redundant な multi-hit が同一経路を駆動する可能性を示した。

考察/結論

本論文は固形腫瘍 (肺腺癌) の matched normal を伴う完全 WGS による包括的体細胞変異解析の先駆けであり、ゲノムワイド変異率 17.7 mut/Mb、喫煙関連 G→T 変換 46%、発現遺伝子への purifying selection (Ka/Ks 0.81)、MAPK 経路の 8 遺伝子多重変異という独自の発見を示した。これまでの肺癌遺伝子変異解析は EGFR・KRAS・TP53 など限定された遺伝子セットの Sanger シークエンシングに依拠していた (Ding et al. Nature 2008) のと対照的に、本研究は WGS で 50,675 体細胞 SNV と 43 構造変異を同時カタログ化し、コーディング領域だけでなくプロモーターや非発現遺伝子への selection pressure を直接定量した点で方法論的革新を達成した。これまでの先行研究との違いとして、Pleasance et al. Nature 2010 が小細胞肺癌 cell line で同様の G→T signature を報告していたが、cell line 由来データは clonal selection を経た集団のため腫瘍内 heterogeneity を反映せず、本研究の primary tumour データはより holistic な disease snapshot を提供した点が 相違 する。

新規性は (a) primary 肺腺癌 + matched normal の同時 WGS という world-first design、(b) 530 SNV を MassARRAY で独立検証する大規模 quality assurance、(c) 発現 vs 非発現遺伝子の Ka/Ks 比を直接対比して機能的領域別 selection pressure を定量化した点、(d) MAPK 経路の 8 遺伝子多重変化を提示して「oncogene addiction」概念に複雑性を追加した点にある。これまで報告されていない GpA/TpC dinucleotide context での G→T 濃縮 (p<10⁻¹⁶) も初めて生殖細胞系列と直接対比して定量された。

臨床応用面では、(1) 喫煙関連変異 signature の定量化は後に Govindan et al. Cell 2012Imielinski et al. Cell 2012 による大規模 cohort で 178 例の smoker vs never-smoker 比較に発展し、現在の tumour mutational burden (TMB) を ICI 効果予測 biomarker として用いる臨床戦略の基盤となった。(2) MAPK 経路の多重変化は「single oncogene 標的治療」だけでは耐性が早期出現することを予測しており、現在の MEK + KRAS G12C inhibitor 併用や RAS-MAPK 経路の multi-node 阻害戦略の理論的基盤となった。(3) 本研究のフレームワークは TCGA Lung Adenocarcinoma project (Sanchez-Vega et al. Cell 2018) や never-smoker 肺癌 (Zhang et al. NatGenet 2021) など数千例規模 cohort に拡張され、臨床的有用性として現代の precision oncology の出発点となった。

残された課題: (1) single-patient 解析のため driver vs passenger 同定には多数 cohort が必要で、recurrence pattern の establishing は今後の検討事項として残された。(2) 腫瘍内 heterogeneity (subclonal evolution) の解析は本データの bulk sequencing では不十分で、single-cell DNA-seq や multi-region sampling による検証が今後の課題である。(3) 50,675 体細胞 SNV のうち functional consequence が validated されたものは数十遺伝子に限られ、large-scale functional screening (CRISPR perturbation library など) との統合が limitation として残された。(4) 構造変異 43 例のうち 16 例は遺伝子領域に breakpoint がなく passenger と推察されたが、その non-coding regulatory effect の評価は今後の展望である。

方法

症例は 25 本/日 × 15 年の喫煙歴を持つ 51 歳男性 Caucasian の poorly differentiated 肺腺癌 (95% tumour content、TTF1 陽性 / KRT5 陰性 IHC で adenocarcinoma 診断) を腫瘍切除時に採取。Complete Genomics 社の DNA ナノボール (DNB) アレイ上での unchained combinatorial probe anchor ligation (cPAL) 化学を用いた WGS (Drmanac et al. Science 2010 の技術) で腫瘍 171.25 Gb (60×)、正常 131.3 Gb (46×) の配列を生成し、参照ゲノム (National Center for Biotechnology Information build 36) にアライメント。体細胞 SNV はローカル de novo アセンブリで検出後、Sequenom MassARRAY プラットフォームで non-coding を含む 530 SNV を独立検証 (検証成功率 70%、コーディング領域 302/418 非同義変異が検証された)。43 の体細胞構造変異を polymerase chain reaction (PCR) と Sanger シークエンシングで検証し、2 例 (染色体 15 inversion と 4q-9p translocation) を bacterial artificial chromosome (BAC) ベース蛍光 in situ hybridization (fluorescence in situ hybridization, FISH) で追加確認。コピー数変化は Affymetrix SNP6.0 アレイと Agilent CGH 244A アレイで独立解析し、遺伝子発現は Affymetrix HU-133 Plus 2.0 GeneChip で測定して発現 vs 非発現遺伝子の変異率比較に使用。Ka/Ks 比 (non-synonymous vs synonymous substitution rate) で selection pressure を定量化、Circos プログラムで genome landscape を可視化した。