- 著者: Kadir C. Akdemir, Victoria T. Le, Justin M. Kim, et al. (PCAWG Consortium)
- Corresponding author: Kadir C. Akdemir; Jesse R. Dixon; P. Andrew Futreal (MD Anderson Cancer Center / Salk Institute)
- 雑誌: Nature Genetics
- 発行年: 2020
- Epub日: N/A
- Article種別: Original Article
- PMID: 33020667
背景
がんゲノムにおける体細胞変異の分布は、ゲノム全体で均一ではなく、遺伝子発現レベル、DNA複製タイミング、転写因子結合部位、核膜近接性など、多くのゲノム特徴と相関することが知られていた。特に、晩期複製ゲノム領域が早期複製領域よりも高変異負荷を示すことは広く認識されていたが、この変異率変動の主要な決定因子についての理解は不完全であった。例えば、DNA修復機構の効率がゲノム領域によって異なる可能性も示唆されていたが、その詳細なメカニズムは未解明であった。
近年、3次元クロマチン構造 (Hi-Cデータ) の解析技術が向上し、ゲノムがトポロジカル関連ドメイン (TAD) に組織化されており、同一TAD内では遺伝子発現、ヒストン修飾、DNA複製タイミングが協調することが明らかになっていた。しかし、3Dクロマチン組織化と体細胞変異率の関係、さらに個々の変異プロセス (変異シグネチャー) がドメイン特異的な変異分布を示すかについては、大規模なコホートを用いた体系的な解析が不足していた。先行研究では、複製タイミングと変異負荷の相関が報告されていたが (例: Lawrence et al. Nature 2013)、TAD構造が複製タイミングの上流に位置し、より根本的な変異分布の決定因子である可能性が示唆されていたものの、その直接的な証拠は確立されていなかった。例えば、Akdemir et al. NatGenet 2020の姉妹論文ではTAD境界が構造変異に影響することが示されており、点変異や変異プロセスに対する影響も同様に重要であると考えられた。また、DNA損傷と修復プロセスがクロマチン構造とどのように相互作用し、変異分布を形成するのかという知識ギャップが残されていた。特に、異なる変異プロセスが特定のクロマチン環境で優先的に発生するのか、あるいは修復されるのかという点は未解明であり、この点が本研究の主要な課題であった。
目的
本研究は、42がん種にわたる全ゲノムシークエンシングデータを用いて、体細胞変異分布と3Dクロマチン組織化 (TADドメイン型・境界) の定量的関係を明らかにすることを目的とした。具体的には、以下の3点を検証する。
- TAD境界が変異負荷変動の代理指標として、従来の複製タイミング測定よりも優れているかを評価すること。これにより、ゲノムワイドな変異率変動のより正確な予測因子を特定する。
- 各変異プロセス (変異シグネチャー) が、活性ドメインまたは不活性ドメインといった特定のクロマチンドメイン型に特徴的な変異分布を示すかを検討すること。これは、DNA損傷と修復機構のドメイン特異的な機能に関する理解を深める。
- X染色体における自然実験(活性X染色体 (Xa) と不活性X染色体 (Xi) の比較)を通じて、TAD構造が変異分布に因果的に影響することを実証すること。これにより、3Dゲノム構造と変異蓄積の直接的な関係を確立する。
これらの目的を達成することで、がんゲノムにおける体細胞変異の蓄積メカニズムに関する包括的な理解を深め、新たな治療戦略開発に貢献することを目指す。
結果
変異負荷とTADドメイン境界の急峻な変化 (TADが複製タイミングを上回る): アクティブ-インアクティブドメイン境界周辺100 kbでの変異負荷変化は20.6%であったのに対し、同領域での複製タイミング変化は6.9%に過ぎなかった (p < 10⁻¹⁰)。これは、TAD境界が複製タイミングよりも変異負荷変動のより良い代理指標であることを示す。この急峻な変異負荷の変化は、アクティブ-アクティブやインアクティブ-インアクティブといった同種ドメイン境界では観察されなかった (Fig. 1a)。このパターンは、黒色腫や食道腺癌など、試験したすべての個別がん種で再現された。変異負荷の急峻な変化部位 (シグナルの二次微分で同定) は、TAD境界と有意に重複した (p < 0.001、ランダムシャッフリングと比較) (Fig. 1f,g)。
ドメイン型が最強の体細胞変異負荷予測因子: ドメインアノテーション型は、ゲノムワイドな変異負荷の最強の単一予測因子の一つであった。アクティブドメインは一貫してインアクティブドメインより低変異負荷を示し、42がん種すべてでこの傾向が確認された。注目すべき点として、同一ドメイン型内での転写領域と非転写領域の比較では変異負荷に有意差がなかった (Fig. 1d; NS)。しかし、アクティブドメインの非転写領域はインアクティブドメインの転写領域より有意に低い変異負荷を示し (p < 10⁻²⁵)、変異負荷差はドメイン全体の特性であり、転写活性だけに依存しないことが示された。この解析にはn=3,000腫瘍サンプルが用いられた。
X染色体での自然実験による強力な証拠: 活性X染色体 (Xa、男性および女性のXa) では常染色体と同様のTAD構造が存在し、変異分布もTADに対応して変動した。500 kbのアクティブ領域 (R1) と隣接インアクティブ領域 (R2) の変異負荷差は、男性Xa (= 活性X) で74.3%であった。対照的に、女性の不活性X染色体 (Xi) はTAD構造が消失した大型抑制ドメインを持つため、変異分布の変動は30.7%と有意に小さかった (Fig. 2c)。Xiで変異負荷が有意に高い点 (p < 10⁻⁶、コピー数補正後) もTAD構造の欠如と一致した。さらに、女性サブクローナル変異はXiでクローナル変異より一様な分布を示し、腫瘍進化でXiがXaより変異蓄積の場となることが示唆された。この現象はn=64 male patientsとn=31 female patientsの慢性リンパ性白血病 (CLL) サンプルで観察された (Fig. 2d)。
変異プロセス別の特徴的なドメイン分布 (2カテゴリへの分類): UV (シグネチャー7)、タバコ煙 (シグネチャー4)、シグネチャー17などの外因性DNA損傷関連シグネチャーは、インアクティブドメインで多く変異を蓄積した。一方、HR欠損関連 (シグネチャー3)、BER (塩基除去修復) 欠損関連 (シグネチャー30・36) などDNA修復欠損関連シグネチャーは、アクティブドメインに多く蓄積した (Fig. 3a)。Pol ε欠損関連シグネチャー10aはインアクティブドメイン優先であったが、10bと28はアクティブドメイン優先と異なるパターンを示し、同じPol ε欠損でも下位シグネチャーの生物学的基盤が異なることが示唆された。NER (ヌクレオチド除去修復) 酵素活性がアクティブドメインで高いことも確認された (Extended Data Fig. 8b)。
MMR欠損 (MSI) での変異分布フラット化のメカニズム: MSI腫瘍では、変異分布がドメインを問わずフラット化することが観察され、MSS腫瘍との顕著な対比をなした。MSI細胞株 (LoVo, DLD1) のHi-Cデータは、健常結腸・MSS細胞株と比較可能なTAD構造を示し、変異分布フラット化がTAD構造自体の変化ではなく、MMR活性のドメイン特異的効率差から生じることが示された。胃癌MSI-MSSの変異負荷差から推定されるMMR効率は、アクティブドメインで有意に高く (Fig. 4f)、インアクティブドメインでのMMR活性の低さがMSS腫瘍での高変異負荷の基盤であることが確認された。この結果は、n=2 DNA repair proficient cell lines (SW480, CaCo2) とn=2 DNA MMR-deficient cell lines (LoVo, DLD1) の比較 Hi-C 解析に基づいている。
APOBEC関連変異のドメイン特異的分布: APOBEC関連変異は活性ドメインに富むことが確認された (Fig. 3a)。Kataegis様クラスター (C-またはG-鎖協調変異クラスター) は、TAD境界および転写活性の高いドメインと有意に重複し (p < 10⁻⁵)、不活性ドメインでは有意に枯渇していた (p < 10⁻⁵) (Fig. 5a,b)。これは、APOBEC関連変異がssDNA (一本鎖DNA) に発生しやすいことに起因すると考えられる。さらに、APOBEC活性が高いサンプルではX染色体変異負荷比率が低いという負の相関が、n=584 female tumor samples全体で観察された (r²: -0.15) (Fig. 5c)。
腫瘍進化における変異分布のシフト: 腫瘍進化の過程で変異プロセスが変化し、それに伴い変異分布もシフトすることが示された。クローナル変異では不活性ドメインに多く変異を蓄積するシグネチャー (例: シグネチャー4、7) が優勢であったが、サブクローナル変異では活性ドメインに多く変異を蓄積するシグネチャー (例: APOBEC関連シグネチャー2, 13) が優勢となる傾向が見られた (Fig. 6a,b)。例えば、ある肺腺癌サンプル (SA286004) では、クローナル変異はタバコ喫煙関連シグネチャー4に富んでいたが、サブクローナル変異はAPOBEC関連シグネチャー2および13に富んでおり、変異分布が不活性ドメインから活性ドメインへと有意にシフトしていた (p < 10⁻¹⁰) (Fig. 6c)。
考察/結論
先行研究との違い: 本研究は、3Dクロマチン組織化、とりわけTAD境界が、変異率変動の主要な決定因子であることを42がん種・6,060万変異という最大規模のデータで初めて直接的に示した点で、これまでの研究とは異なる。従来の複製タイミングモデルに対し、TAD境界が変異負荷変動のより正確な代理指標となること (20.6% vs 6.9%) は、方法論的・概念的に重要な貢献である。Lawrence et al. Nature 2013などの先行研究では複製タイミングと変異負荷の相関は認識されていたが、本研究はTAD構造が複製タイミングの上流に位置し、より根本的な変異分布の決定因子であることを大規模コホートで実証した点で、これまでの研究とは異なる。
新規性: X染色体での自然実験 (Xa/Xiの比較) は因果関係の証拠として特に力強く、変異分布パターンがTAD構造に依存することを実験的な介入なしに示した最もエレガントな証拠の一つである。また、変異シグネチャーをドメイン優先性で2カテゴリに分類した知見は、DNA損傷・修復機構がドメイン特異的に機能することを新規に示し、今後の変異シグネチャー解析に新たな文脈を与える。MMR (ミスマッチ修復) 欠損 (MSI) 腫瘍での変異フラット化がTAD構造自体の変化ではなくMMR修復効率のドメイン特異性に起因することをHi-C比較実験で直接証明した点も、これまで報告されていない新規な発見である。
臨床応用: クロマチンドメイン型が高変異負荷領域を予測できることは、腫瘍変異負荷 (TMB) の解釈と免疫療法の反応予測に貢献する可能性がある。Yarchoan et al. NEnglJMed 2017が示すように、TMBは免疫療法反応と関連するため、変異分布の3D空間的文脈を考慮することで、WGSデータからより精度の高いドライバー変異同定やシグネチャー解析が可能となる。また、がん種別の変異分布差がローカルなクロマチン折りたたみ差を反映するという知見は、複数がん種の比較ゲノミクス研究における新たな解析軸を提供する。不活性X染色体 (Xi) の高変異負荷は、女性のがん患者における免疫療法反応予測や、Xi再活性化による新規ネオアンチゲン産生を介した治療戦略開発の可能性を示唆する。
残された課題: 今後の検討課題として、クロマチン組織化が変異率を制御する分子機序のさらなる解明 (DNA修復因子のドメイン特異的局在・活性)、腫瘍進化の時系列における3Dゲノム変化と変異蓄積の因果関係、および患者個別Hi-Cデータを用いた変異分布の個別化解析が残されている。本研究のlimitationとして、Hi-Cデータが細胞株由来であるため、生体内の腫瘍組織におけるクロマチン構造の動態を完全に反映しているとは限らない点が挙げられる。
方法
本研究では、42がん種3,000腫瘍-正常ペアの全ゲノムシーケンス (WGS) データ (PCAWG由来) から、合計6,060万の体細胞変異を抽出した。この大規模なコホートは、変異分布の汎がん種的なパターンを評価する上で強固な基盤を提供する。
クロマチン構造の解析には、5細胞株のHi-Cデータ (25 kb分解能) を用いて、共通TAD境界2,477箇所を同定した。これらの共通TAD境界は、がん細胞株のTAD境界と63%重複することを確認し、その汎用性を示した。各ゲノム領域は、125種類のヒト細胞型のクロマチン状態に基づき、6つのドメイン型 (アクティブ、アクティブ2、インアクティブ、ヘテロクロマチン、リプレストなど) に分類された。このドメイン分類は、ATAC-seqとDNAメチル化データを用いて、クロマチンアクセシビリティとの相関が評価された。
変異負荷とドメイン型・TAD境界の関係は、全42がん種で系統的に評価された。具体的には、25kbの非重複ウィンドウでゲノムをビン化し、各ウィンドウ内の変異数を集計した。変異負荷の急峻な変化部位は、平滑化された変異負荷シグナルの二次微分を計算することで同定された。これらの変化部位とTAD境界との重複は、ランダムシャッフリングと比較することで統計的有意性が評価された (p < 0.001)。
X染色体における解析では、アレル特異的Hi-Cマップ (活性X/不活性X) を用い、男女間での変異分布差を比較した。性別に強く偏ったがん種 (乳癌、前立腺癌、卵巣癌、子宮腺癌) は除外された。女性の不活性X染色体 (Xi) はTAD構造が消失した大型抑制ドメインを持つため、変異分布の変動が活性X染色体 (Xa) と比較して小さいことを検証した。
変異シグネチャー別のドメイン型選好性を解析するため、Alexandrov et al. Nature 2020で報告されたSigProfilerアルゴリズムによって抽出された変異シグネチャーの寄与度を用いた。各シグネチャーが活性ドメインと不活性ドメインのどちらに多く変異を蓄積するかを定量的に評価した。
DNAミスマッチ修復 (MMR) 欠損 (MSI) 腫瘍における変異分布のフラット化メカニズムを解明するため、MMR欠損結腸癌細胞株 (LoVo, DLD1) とMMR正常結腸癌細胞株 (SW480, CaCo2) の25 kb分解能Hi-Cデータを取得し、TAD構造を比較した。さらに、胃癌のMSI-MSSサンプル間で変異負荷差を計算し、MMR効率のドメイン特異性を推定した。統計解析には、Wilcoxon rank-sum testが主に用いられた。