• 著者: Erin D. Pleasance, Philip J. Stephens, Sarah O’Meara, David J. McBride, Alison Meynert, David Jones, Meng-Lay Lin, Michael R. Stratton, P. Andrew Futreal, Peter J. Campbell
  • Corresponding author: Peter J. Campbell (Wellcome Trust Sanger Institute)
  • 雑誌: Nature
  • 発行年: 2010
  • Epub日: 2009-12-16
  • Article種別: Original Article
  • PMID: 20016488

背景

SCLC (small-cell lung cancer: 小細胞肺癌) は全肺がんの約15%を占め、早期転移、化学療法への初期奏効後の急速な再発、および2年生存率15%未満という極めて厳しい臨床経過をたどる難治性悪性腫瘍である。Sher et al. (2008) はSCLCの基本的疫学と病態をまとめた総説において、早期転移と化学療法後早期再発という臨床的課題を明示している。SCLC腫瘍の97%超が喫煙と直接的に関連しており、タバコ煙には60種以上の変異原性化学物質が含まれている。これまでの分子遺伝学的研究から、TP53変異 (80-90%) やRB1不活化 (60-90%)、PTEN変異 (13%) が特徴的なゲノム変化として知られ、MYC増幅が約20%に認められることが報告されていた。Pfeifer et al. (2002) はタバコ煙発がん物質によるDNA損傷とTP53変異のシグネチャーを詳述し、Hecht et al. (2008) はタバコ発がん物質の化学的分類と変異誘発メカニズムを体系化したが、これらの先行研究はいずれも特定遺伝子に限られたターゲットシーケンスの知見に基づいていた。2008年から2009年にかけて、急性骨髄性白血病の全ゲノム解析が発表されたものの、タバコ関連腫瘍における全ゲノム規模での体細胞変異の包括的解析は存在しなかった。すなわち、タバコ発がん物質がゲノム全域に及ぼす変異スペクトラムの全体像、DNA修復経路の活動証拠、および新規ドライバー遺伝子候補となる染色体再配列を同時に解析できる研究が決定的に不足していた。このゲノムワイドな変異プロセスの解明における大きなギャップが、本研究の着手動機となった。このように、全ゲノム規模での包括的な変異負荷や、外因性変異原と内因性修復機構の相互作用の全体像は依然として未解明であり、詳細なゲノム情報が圧倒的に不足しているという課題が残されていた。

目的

次世代シーケンシング技術を用いてSCLC細胞株の全ゲノムを解読し、タバコ喫煙関連がんにおける全体的な体細胞変異負荷を定量化することを目的とした。さらに、ゲノムワイドな解析を通じて、タバコ煙に含まれる多様な発がん物質に由来する複数の変異シグネチャーを同定すること、転写や遺伝子発現と連動したDNA修復経路の活動を示す生物学的証拠を明らかにすること、そして新規ドライバー遺伝子候補となる染色体再配列や融合遺伝子を同定することを目的とした。

結果

SCLC全ゲノムにおける体細胞変異カタログ: NCI-H209ゲノムにおいて、合計22,910個の体細胞置換、65個のインデル、334個のコピー数セグメント、および58個の構造変異を同定した (Table 1, Fig 1c)。コーディング領域における置換は、ナンセンス変異4件、非同義置換94件、同義置換36件を含む計134件 (全体の0.6%) であった。既知のSCLCドライバー変異であるRB1 C706F変異およびTP53スプライス部位変異の両方が確認され、NCI-H209がSCLCの代表的なゲノム特徴を有していることが検証された。また、ヒストンメチル基転移酵素をコードするMLL2遺伝子において、未成熟終止コドンを生じるG→T transversionが1件同定された。コーディング領域における非同義置換と同義置換の比率は2.61:1であり、偶然期待される比率と有意差は認められず (p=0.3)、検出されたコーディング変異の大部分が選択的優位性を持たないpassenger変異であることが示された。さらに、転写開始部位から2 kb以内のプロモーター領域における変異分布も均一であり、プロモーター変異もほぼ中立的に蓄積していることが明らかとなった。

タバコ発がん物質に由来する複数の変異シグネチャー: 約23,000個の体細胞置換の塩基コンテキスト分析により、タバコ煙中の発がん物質に起因する複数の変異シグネチャーを極めて高い統計的精度で識別した (Fig 2)。最も頻度が高かったのはG→T/C→A transversion (34%) であり、これは多環芳香族炭化水素やアクロレインによるDNA損傷パターンと一致した。次いでG→A/C→T transition (21%)、A→G/T→C transition (19%) の順であった。G→T変異はCpGジヌクレオチドにおいて有意に濃縮されており、オッズ比は OR 1.5 (95% CI 1.3-1.6, p<0.0001) であり、特にメチル化頻度が高いCpGアイランド外の領域に集積しており、オッズ比は OR 1.8 (95% CI 1.1-2.8, p=0.02) であった。これは、メチル化されたシトシンの隣接グアニンに対してタバコ発がん物質が優先的に結合するという化学的特性を裏付けるものである。G→A変異ではCpGジヌクレオチドでの濃縮がさらに顕著であり、オッズ比は OR 4.0 (95% CI 3.7-4.3, p<0.0001) であり、CpGアイランド外への偏りは OR 2.6 (95% CI 1.6-4.1, p<0.0001) となり、自然発生的な5-メチルシトシンの脱アミノ化機構と一致した。一方、G→C transversionはCpGアイランド内に有意に集積しており、オッズ比は OR 0.6 (95% CI 0.4-1.0, p=0.05) であり、非メチル化CpGを標的とする特定の多環芳香族炭化水素の関与を示唆した。

2種類のDNA修復経路の活動証拠: 全置換変異の転写鎖バイアスと遺伝子発現量との相関解析から、ゲノム防衛を担う2つの独立したDNA修復経路の活動が明らかとなった (Fig 2e)。第1に、転写共役修復 (TCR: transcription-coupled repair) の関与を示す証拠として、G→T (p<0.0001)、A→G (p=0.003)、A→T (p=0.03) の変異クラスにおいて、転写鎖の変異数が非転写鎖に比べて有意に減少しているストランドバイアスが確認された。第2に、本研究において新たに発見された「発現連鎖修復 (expression-linked repair)」経路の印跡が同定された。これは、G→T (p<0.0001)、G→A (p<0.0001)、G→C (p<0.0001)、A→T (p<0.0001) の変異において、遺伝子発現レベルが高くなるにつれて、転写鎖と非転写鎖の両方で変異頻度が均等に低下する現象である。重要な点として、A→G変異はTCRのみによって修復され (高発現遺伝子において転写鎖のみ減少)、G→A変異は発現連鎖修復のみによって修復される (高発現遺伝子において両鎖が均等に減少) という、変異クラス間での修復経路の選択性の違いが初めて明らかになった。

CHD7遺伝子の反復的染色体再配列: NCI-H209において、クロマチンリモデリング因子をコードするCHD7遺伝子に39.5-kbのタンデム重複を同定し、これがエクソン3-8のin-frame重複を引き起こすことを確認した (Fig 4a)。別のSCLC細胞株であるNCI-H2171では、MYC遺伝子の下流に位置するノンコーディングRNA遺伝子であるPVT1のエクソン1-3と、CHD7のエクソン4-38が融合した高発現融合遺伝子が同定されていた。63系統のSCLC細胞株を対象としたMLPAスクリーニングにより、新たにLU-135細胞株においてCHD7のゲノム構造異常を検出した。LU-135のメイトペアシーケンス解析により、MYC領域のゲノム増幅に伴い、PVT1のエクソン1とCHD7のエクソン14-38が結合した新規融合遺伝子 (PVT1-CHD7) の存在が明らかとなった (Fig 4c)。RT-PCRにより、この融合転写産物が実際に発現していることが確認された。CHD7の発現レベルは、SCLCにおいて非小細胞肺がん (NSCLC) やその他の腫瘍型と比較して有意に高く (log2スケール、p<0.0001)、特に再配列を有するLU-135およびNCI-H2171において極めて高い過剰発現が認められた (Fig 4d)。

タバコ曝露に伴う変異レートの推算: 喫煙によるゲノムへの変異負荷を定量化するため、肺がん患者が平均50パック年の喫煙歴 (合計約7,300本のタバコ消費) を有すると仮定し、NCI-H209で同定された22,910個の体細胞置換から変異レートを算出した。その結果、がん化するクローンにおいて「タバコ約15本の喫煙につき、ゲノム中に1個の体細胞変異が導入される」という具体的な推算値が導き出された (Fig 1c)。この定量的な指標は、喫煙がゲノム全体に及ぼす破壊的な影響を視覚化し、禁煙介入の重要性を分子レベルで裏付ける強力な公衆衛生的メッセージとなった。

考察/結論

先行研究との違い: 従来のタバコ煙によるゲノム損傷研究は、TP53やKRASなどの特定の標的遺伝子における限定的なシーケンス解析に留まっており、ゲノム全体における変異プロセスの全貌は不明であった。本研究は、これまでの限定的なアプローチと対照的に、次世代シーケンシング技術を用いて約23,000個の体細胞変異を網羅的に同定し、ゲノムワイドな統計的検出力をもって複数の変異シグネチャーを初めて識別した。また、先行して報告されていた急性骨髄性白血病の全ゲノム解析と異なり、本研究はタバコという明確な外因性発がん物質に曝露された固形がんゲノムを対象とすることで、外因性変異原と内因性DNA修復経路との複雑な相互作用を初めて明らかにした。

新規性: 本研究は、タバコ関連がんにおける初の包括的な全ゲノム体細胞変異カタログを作成した点において極めて高い新規性を有する。さらに、高発現遺伝子の両鎖において変異頻度が低下する「発現連鎖修復」という新しいDNA修復経路の存在をゲノム解析から本研究で初めて提示した。また、SCLCにおいてクロマチンリモデラーであるCHD7遺伝子の反復的な染色体再配列 (タンデム重複およびPVT1-CHD7融合遺伝子) を新規に同定し、これがSCLCの新たなドライバー遺伝子候補であることを示した。本研究の発見は、後の Peifer et al. NatGenet 2012Rudin et al. NatGenet 2012 による大規模なSCLCゲノム解析において拡張・検証され、変異シグネチャーの概念は Kucab et al. Cell 2019 らによって体系化されるに至った。

臨床応用: 本研究が提示したゲノムワイドな変異シグネチャー解析は、個々の患者における発がん物質への曝露評価や、がん予防・早期診断戦略の策定における臨床的有用性を持つ。また、SCLCゲノムが極めて高い変異負荷 (TMB: tumor mutational burden) を有するという事実は、後年の Hellmann et al. CancerCell 2018 等における免疫チェックポイント阻害薬に対する治療応答性の予測因子としてのTMBの臨床応用へと繋がった。さらに、CHD7再配列の同定は、治療選択肢の極めて乏しいSCLCにおける新規の分子標的治療薬開発に向けた translational な基盤を提供するものである。

残された課題: 本研究における最大の limitation は、解析対象がNCI-H209という単一の細胞株に限定されている点であり、原発臨床腫瘍における変異スペクトラムとの直接的な比較検証が今後の検討課題として残されている。また、同定されたCHD7再配列が有する機能的な役割や、腫瘍形成における具体的な発がん機序を解明するためには、さらなる in vitro および in vivo での機能解析が必要である。新しく提唱された発現連鎖修復経路についても、その詳細な分子機構や関与する修復酵素群の同定など、今後の研究による解明が待たれる。

方法

細胞株とコントロール: 55歳男性のSCLC患者の骨髄転移巣から化学療法開始前に樹立され、古典的神経内分泌特性を有する細胞株であるNCI-H209 (National Cancer Institute-H209) を使用した。マッチした正常コントロールとして、同一患者由来のEBV (Epstein-Barr virus) 形質転換B細胞株であるNCI-BL209 (National Cancer Institute-B-Lymphoblastoid 209) を使用した。NCI-H209は分光核型解析、capillaryシーケンス、および高解像度コピー数アレイにより広範に特性解析がなされている。

シーケンスとアライメント: SOLiD (Sequencing by Oligonucleotide Ligation and Detection) プラットフォームを用い、25-bpショートリードのメイトペアショットガンシーケンスを実施した。腫瘍ゲノムから112 Gb (平均カバレッジ 39x coverage)、正常ゲノムから90 Gb (平均カバレッジ 31x coverage) のシーケンスデータを取得し、NCBI36 (National Center for Biotechnology Information build 36) 参照ゲノムにアライメントした。統計的検出力計算に基づき、1 Mb当たり1変異の真の変異頻度を前提として、高感度かつ高特異的な変異同定には30x以上のカバレッジが必要であると算出した。

変異同定アルゴリズムと検証: 体細胞置換、インデル (挿入・欠失)、コピー数変化、および構造変異を同定するための独自バイオインフォマティクスアルゴリズムを開発した。PCRおよびcapillary sequencingにより、すべての構造変異とインデル、コーディング領域の置換77件 (確認率 97%)、およびランダムに選択した非コーディング変異333件 (確認率 94%) を検証した。インデルの真陽性率は25%であったため、capillary sequencingで確認された信頼性の高いインデルのみを最終解析対象とした。

CHD7再配列解析: CHD7 (chromodomain helicase DNA binding protein 7) の反復的再配列を検索するため、MLPA (multiplex ligation-dependent probe amplification) 法を用いて63系統のSCLC細胞株をスクリーニングした。LU-135細胞株についてはメイトペアシーケンスを実施し、CHD7-PVT1 (plasmacytoma variant translocation 1) 融合転写産物の発現をRT-PCRおよびcapillary sequencingで確認した。

統計解析: Affymetrix U133Aマイクロアレイを用いて遺伝子発現量を測定し、Poisson regression (ポアソン回帰) モデルを用いて遺伝子発現量と変異頻度との関連を分析した。CpGジヌクレオチドとの関連はchi-square test (カイ二乗検定) で評価し、転写鎖バイアスは変異クラス別に独立して検定した。