- 著者: Kucab JE, Zou X, Morganella S, Joel M, Nanda AS, Nagy E, et al.
- Corresponding author: Phillips DH (King’s College London); Nik-Zainal S (Wellcome Sanger Institute / University of Cambridge)
- 雑誌: Cell
- 発行年: 2019
- Epub日: N/A
- Article種別: Original Article
- PMID: 30982602
背景
癌ゲノムに蓄積する体細胞変異のパターン、すなわち変異シグネチャーは、変異プロセスの「分子的痕跡」として、発がん因子への曝露歴を反映する。18世紀の英国医師が煤への慢性曝露と陰嚢癌の関連を初めて記述して以来、タバコ、アニリン染料、アスベスト、アフラトキシン、ベンゼン等と特定の癌の関連が疫学的に確立されてきた。COSMICデータベースにカタログ化された腫瘍シグネチャー (SBS1–SBS60以上) のうち、既知の原因が帰属されているものは喫煙 (SBS4)、UV (SBS7)、アフラトキシン (SBS24) 等一部に限られており、大多数のシグネチャーの分子的起源は不明のままであった。この知識のギャップは、がんの予防戦略や治療法の開発を妨げる要因となっている。
先行研究では、特定の単一遺伝子 (TP53、RAS等) における変異スペクトルの解析が行われてきたが、全ゲノムスケールでの系統的な環境因子スクリーンは実施されていなかった。例えば、TP53変異スペクトル解析では、肺癌における喫煙関連のG>Tトランスバージョンや、UV関連皮膚癌におけるC>T/CC>TT変異が報告されている (Pfeifer et al. 2000)。しかし、これらの研究は単一遺伝子に限定されており、ゲノム全体の変異プロファイルを網羅的に捉えることはできなかった。全ゲノムシーケンシング (WGS) を単一の悪性黒色腫・肺癌細胞株に適用した先駆的研究がUV・タバコの特徴的シグネチャーを示したが (Pleasance et al. 2010a, 2010b)、コントロールされた条件下での79種類の環境因子に対する網羅的カタログ化は本研究が初めてであった。
ヒト腫瘍における変異シグネチャーの数学的デコンボリューションは、実験的コントロールの欠如により解釈が困難な場合が多く、特定の環境因子が誘導する変異シグネチャーを直接的に同定する体系的なアプローチが不足していた (Helleday et al. NatRevGenet 2014)。このため、環境発がん物質がヒト細胞にどのような変異シグネチャーを誘導するかを、実験的に制御された条件下で網羅的に解析し、その結果を既知の腫瘍シグネチャーと比較することで、未解明な腫瘍シグネチャーの起源を特定するためのリファレンスデータセットを構築することが喫緊の課題であった。本研究は、この知識のギャップを埋め、環境曝露とがんの因果関係を分子レベルで解明するための基盤を提供することを目指した。
目的
本研究の目的は、79種類の環境因子 (職業性・環境性・医原性発がん物質、化学療法薬、天然物) がヒトiPSC (誘導多能性幹細胞) に誘導する変異シグネチャーを全ゲノムシーケンシング (WGS) を用いて体系的にカタログ化することである。具体的には、これらの環境因子が誘導する塩基置換、二重塩基置換、およびインデル変異のプロファイルを詳細に解析し、COSMICデータベースに登録されている既知のヒト腫瘍シグネチャーとの対応関係を確立することで、環境曝露の分子的痕跡を同定することを目的とした。
さらに、本研究は、各環境因子が誘導する変異シグネチャーの特性 (例: 転写方向バイアス、複製タイミングドメインにおける分布) を解析することで、DNA損傷応答 (DDR) およびDNA修復経路の関与を解明し、変異生成のメカニズムに関する新たな知見を得ることを目指した。最終的に、この包括的な変異シグネチャーのカタログを、がんの病因における環境因子の役割をさらに探求するための貴重なリソースとして提供し、未解明な腫瘍シグネチャーの原因帰属に貢献することを目的とした。
結果
全体スクリーン結果と変異誘導能: 79種類の環境因子中41因子 (52%) が有意な塩基置換シグネチャーを誘導した。n=324サブクローンの解析において、6因子が二重塩基置換 (DBS) シグネチャーを、8因子がインデルシグネチャーを誘導した。38因子はいずれの有意なシグネチャーも生成せず (p < 0.01の有意性基準を満たさず)、陰性対照としての価値をもった。同一処理の複数サブクローン間でシグネチャーの一貫性が確認され、実験系の再現性が担保された。コントロールクローンでは平均約245塩基置換、約1二重塩基置換、約10インデル/ゲノムのバックグラウンド変異が確認され、処理誘導シグネチャーとの識別が可能であった (Figure 2A-C)。各処理の変異原性指数 (mutagenicity index) は大きく異なり、AAI、UV、PAH関連化合物は高い変異誘導能を示した (Figure 2D)。
UV/太陽光シミュレーション放射線 (SSR) シグネチャー: UVCおよびUVA照射により誘導されたシグネチャーは、COSMIC SBS7とコサイン類似度0.94でマッチし、皮膚黒色腫腫瘍シグネチャーと一致した (Figure S3A)。SSRで誘導された塩基置換の91%がC→T/G→A転移であった。二重塩基置換では特徴的なCC→TTパターンがUV特異的として同定され、これはUVによるピリミジンダイマー形成を反映する。このシグネチャーは、UV曝露されたn=3 MEFsでも観察された (Nik-Zainal et al. 2015)。
アリストロコッチン酸 (AAI) シグネチャー: 泌尿路上皮癌と関連するAAIシグネチャーは、腎臓および膀胱の腫瘍AAIシグネチャー (COSMIC SBS22) とコサイン類似度0.99という極めて高い一致を示した (Figure S3A)。このシグネチャーはA→T/T→A転換が優位であり、Balkan諸国やアジアのAAI関連腎癌の分子疫学的証拠と完全に整合した。AAIが全シグネチャーの83%をT→A/A→T転換が占めるのに対し、類似構造のAAIIは異なるパターンを示し、同一ファミリー内でも差異があることが明らかとなった。この結果は、n=3 MEFsを用いた先行研究 (Nik-Zainal et al. 2015) とも一致する。
多環芳香族炭化水素 (PAH) シグネチャー: ベンゾ[a]ピレン (BaP)、ジベンズ[a,h]アントラセン (DBA)、ジベンゾ[a,l]ピレン (DBP) の各シグネチャーは、対応するジオールエポキシド代謝物 (BPDE、DBADE、DBPDE) のシグネチャーと互いに類似し、代謝活性化なしの親化合物よりも代謝物との類似度が高かった。BaP、BPDE、DBA、DBPのシグネチャーは、喫煙関連肺癌シグネチャー (COSMIC SBS4) と高い類似度 (コサイン類似度0.84-0.95) を示した (Figure S3B)。これら4因子は、塩基置換、二重塩基置換、インデルの3クラス全てのシグネチャーを誘導した稀な化合物であり、変異誘導力はBaPで最大約10倍以上の差があった。S9代謝活性化下では、親PAH化合物の変異誘導能が対応するジオールエポキシド代謝物と同等に上昇し、ジオールエポキシド経路が主要な活性化経路であることが確認された (Figure 6B)。PAH関連シグネチャーでは、CpGメチル化部位でのG>T/C>A変異の頻度が有意に高かった (p < 0.01)。
プラチナ製剤シグネチャー: シスプラチンとカルボプラチンの塩基置換シグネチャーは、G→A/C→T優位で高い類似度 (コサイン類似度0.95) を示した。G→A転移はGpGpGまたはApGpG配列に集中した。二重塩基置換ではAG→TT、GA→TT優位のパターンが同定され、GpG、ApGジヌクレオチドへの白金架橋に対するA-rule (Strauss) に従うミスレプリケーションによる固定を反映した (Figure 4C)。シスプラチンはGpGジヌクレオチド下流のT挿入を特徴とするインデルシグネチャーを誘導した (Figure 5C)。これらは白金系化学療法後の腫瘍シグネチャーと一致した。
アルキル化剤シグネチャー: 5種類のアルキル化剤が変異パターンを生成し、これらは2つのグループにクラスター化された。エチルニトロソウレア (ENU) とメチルニトロソウレア (MNU) はテモゾロミド (temozolomide) と共にクラスターを形成し、T→C/A→G転移が優勢なシグネチャー (それぞれ85%、50%、78%) を示した。ジエチルスルフェート (DES) とジメチルスルフェート (DMS) はC→T/G→A転移 (それぞれ40%、29%) も含むシグネチャーを示した。1,2-ジメチルヒドラジン (1,2-DMH) は、T→C/A→G (33%) とC→T/G→A (42%) がほぼ同量であり、他のアルキル化剤とは異なるシグネチャーを示した。特に、1,2-DMHのC→T/G→A成分はCOSMIC SBS11に類似し、NpCpCおよびNpCpT配列で最も高いピークを示した (コサイン類似度0.89)。
転写方向バイアスと修復経路: 処理シグネチャーの多くで転写鎖と非転写鎖間の変異頻度差異 (転写方向バイアス) が有意に確認され、転写共役ヌクレオチド除去修復 (TC-NER) の活発な機能が示唆された (Figure 7A)。特にBPDE等のPAH関連化合物は、早期複製タイミングドメイン (early RTD) での転写方向バイアスが晩期RTDより顕著であり、TC-NERの複製タイミング依存的効率差が示された (Figure 7B)。n=324 iPSC subclones全てでDNA二重鎖切断 (DSB) 修復、ミスマッチ修復 (MMR)、TC-NERが全て完全に機能していることが確認された。コントロール細胞のバックグラウンドシグネチャーは、晩期RTDでより多くの変異を示す傾向があり、これは培養中のROSによる損傷とMMRの機能を示唆する (Figure S6)。
考察/結論
先行研究との違い: 従来の研究では、TP53などの単一遺伝子を標的としたin vitro系が主流であり、1サンプルあたり1変異程度の情報しか得られなかった。これに対し、本研究ではWGSを用いることで、1クローンあたり数百〜数万の変異をゲノムワイドに解析することが可能となり、変異シグネチャーの解像度と網羅性を飛躍的に向上させた。また、実験制御されたiPSC曝露系は、複雑な腫瘍環境 (多重内因性変異プロセス、不均一な修復能) から切り離して個々の環境因子の変異原性を評価できる点で、これまでの疫学研究や腫瘍ゲノム解析とは対照的な、直接的な因果関係の分子証拠を提供する。
新規性: 本研究で初めて、79種類の環境因子に対する変異シグネチャーの包括的なカタログが作成された。特に、アリストロコッチン酸 (AAI) のシグネチャーが、ヒト泌尿路上皮癌のCOSMIC SBS22とコサイン類似度0.99という極めて高い一致を示したことは、環境曝露とがんの因果関係を分子レベルで直接的に結びつける新規な証拠である。また、多環芳香族炭化水素 (PAH) のシグネチャーが、そのジオールエポキシド代謝物のシグネチャーと高い類似性を示したことは、PAHの変異原性における代謝活性化経路の重要性を明確に示した新規な知見である。さらに、多くのシグネチャーで転写方向バイアスが確認され、iPSCにおける転写共役ヌクレオチド除去修復 (TC-NER) の機能が示唆されたことも新規性として挙げられる。
臨床応用: 本研究で構築された変異シグネチャーのカタログは、将来的に個別患者の腫瘍ゲノム解析において、発がん曝露歴を推定する「ゲノム法医学」的アプローチの基盤となる。例えば、AAIのように極めて高い一致を示すシグネチャーは、法的・疫学的文脈で因果関係の直接証拠として活用できる可能性がある。これにより、がんの予防戦略や、特定の環境曝露に関連するがん患者の層別化、さらにはコンパニオン診断的ツールの開発に繋がる臨床的意義を持つ。
残された課題: 本実験系の限界として、いくつかの点が残された課題として挙げられる。第1に、iPSCは非悪性細胞であり、腫瘍特有の修復能低下や変異蓄積環境とは異なる可能性がある。第2に、単一曝露条件であり、複合曝露や慢性的低用量曝露は反映されない。第3に、単一細胞株を使用しているため、組織特異的なDNA修復差異の影響は評価されていない。今後の検討課題として、異なる細胞タイプやDNA修復欠損背景を持つ細胞株を用いた実験、あるいは複合曝露モデルの導入が挙げられる。また、教師ありフィッティングによる誤帰属リスクへの注意も必要であり、シグネチャー解析の解釈には慎重さが求められる。
方法
本研究では、ヒトiPSC (Ti-iPSC) を実験モデルとして使用した。この細胞株は、正常で未分化であり、増殖が速く、クローニングが容易であるという利点を持つ。79種類の環境因子 (化学発がん物質、治療薬、DNA損傷応答 (DDR) 阻害剤、放射線源など) を対象とし、各因子に対して40%〜60%の細胞傷害性を示す低毒性濃度で細胞を処理した。一部の処理 (n=19) では、80%以上の細胞傷害性を示す高濃度も使用された。化学物質の種類は、アルキル化剤、芳香族アミン、多環芳香族炭化水素 (PAH)、紫外線、ニトロ化多環芳香族炭化水素 (nitro-PAH)、プラチナ製剤、フリーラジカル生成物などを網羅した。
代謝活性化が必要な化合物 (28/77剤) については、S9ラット肝臓由来代謝酵素混合物添加下でも試験を行った。128種の処理培養から、単細胞クローニングによりn=324サブクローンを取得し、全ゲノムシーケンシング (WGS) を実施した。WGSの平均カバレッジは30倍であった。得られたショートリードシーケンスは、ヒト参照ゲノムアセンブリGRCh37/hg19にアラインされ、親iPSCクローンから体細胞変異がコールされた。変異アレル頻度 (VAF) が0.2以上の変異を対象とし、サブクローン間で共有される変異は除去してde novo体細胞変異を特定した。
バックグラウンド変異数は、溶媒対照を含むn=15コントロールクローンで確認された (平均約245塩基置換、約1二重塩基置換、約10インデル/ゲノム)。処理誘導シグネチャーの同定には、非負値行列因子分解 (NMF) とSignatureAnalyzerを使用し、処理群がコントロールより有意に高い変異数 (q < 0.01、置換検定) を示す場合のみシグネチャーとして確定した。さらに、シグネチャーの安定性 (サブクローン間の一貫性) を評価し、安定性スコアが0.8以上のシグネチャーを信頼性の高いものとして報告した。COSMICシグネチャーとのマッチングはコサイン類似度で評価した。全サブクローンで染色体コピー数を評価し、diploid状態が維持されていることを確認した。
ゲノム地形学的解析として、複製鎖および転写鎖バイアス、複製タイミングドメイン (RTD) における変異分布、およびCpGメチル化状態がPAH変異原性に与える影響を調査した。複製鎖およびRTDに関する参照情報はENCODEプロジェクトのRepli-seqデータから取得し、転写鎖座標はタンパク質コード遺伝子のフットプリントから得た。CpGアイランド座標はGardiner-Garden et al. (1987) の研究から取得した。統計解析はRを用いて行われ、ピアソンカイ二乗検定により鎖バイアスの有意性を評価した。また、変異コールにはCaVEMan、Pindel、BRASSが使用された。