- 著者: Tyler Funnell, Ciara H. O’Flanagan, Marc J. Williams, Sohrab P. Shah, Samuel Aparicio
- Corresponding author: Marc J. Williams; Sohrab P. Shah; Samuel Aparicio (Memorial Sloan Kettering Cancer Center / BC Cancer Research Centre)
- 雑誌: Nature
- 発行年: 2022
- Epub日: 2022-10-05
- Article種別: Original Article
- PMID: 36289342
背景
ゲノム不安定性はがんの主要な特徴であり、細胞間コピー数変異 (CNA: copy number alteration) が腫瘍進化を駆動することが知られている。しかし、従来のバルク全ゲノムシーケンス (WGS) では、数百万個の細胞からなるDNAプールの平均シグナルしか得られず、同時進行する細胞ごとのリアルタイムな変異イベントは検出できないという根本的な限界があった。このため、ゲノム不安定性によって引き起こされる個々の細胞レベルでの変異パターン、およびそれが腫瘍内の表現型および進化的多様性にどのように寄与するかは、これまで十分に解明されておらず、大きな研究上のギャップ (gap) が残されていた。特に、相同組換え欠損 (HRD: homologous recombination deficiency) やブレイク・フュージョン・ブリッジサイクル (BFBC: breakage-fusion-bridge cycle) などの内因性変異プロセスは、タンデム重複、間質性欠失、フォールドバックインバージョン (FBI: fold-back inversion) といった特定の構造的変異 (SV: structural variation) パターンを蓄積させ、高レベルのコピー数増幅を引き起こすことが報告されている (Alexandrov et al. Nature 2013、Alexandrov et al. Nature 2020、Watkins et al. Nature 2020)。これらのプロセスが個々の細胞レベルでどのような多様性を生み出すかは不明であった。また、母系・父系アレル別にCNAを区別するハプロタイプ特異的解析は、ゲノム規模の構造変異を包括的に理解するために不可欠であるが、単一細胞レベルで大規模に実施された前例はなかった。このような背景から、がんゲノムにおける細胞間構造変異の「前景 (foreground)」パターンを同定し、その表現型および進化的多様性への寄与を定量化するための新たなアプローチが不足しており、ゲノム不安定性によって生じる細胞間変異の多様性とその表現型への影響に関する包括的な理解には、依然として大きな課題が残されていた。このように、単一細胞レベルでのハプロタイプ特異的な構造変異の動態を大規模に追跡する手法が不足しており、がん進化における進化的・表現型的多様性の創出メカニズムには未解明な領域が多く、依然として大きな knowledge gap が残されている。
目的
本研究の目的は、スケール化単一細胞全ゲノムシーケンスである DLP+ (direct library preparation plus) 法とハプロタイプ特異的解析を組み合わせたアプローチを開発・適用し、がんにおける細胞間構造変異の「前景」パターンを体系的に同定・定量化することである。具体的には、in vitroの等遺伝子系乳腺上皮細胞株(野生型、TP53欠損、TP53/BRCA1欠損、TP53/BRCA2欠損)およびトリプルネガティブ乳がん (TNBC) と高悪性度漿液性卵巣がん (HGSC: high-grade serous ovarian cancer) 患者由来腫瘍サンプルにこの技術を適用し、細胞間構造変異によって定義される主要な変異パターンを特定する。さらに、これらの変異パターンが腫瘍の表現型および進化的多様性にどのように寄与するかを定量的に評価することを目的とした。この目的を達成するため、ハプロタイプ特異的CNA解析のための新規隠れマルコフモデル (HMM: hidden Markov model) ベースのアルゴリズム SIGNALS の開発と検証も重要な目標とした。
結果
BRCA1欠損による高い細胞間ゲノム変動の誘導: CRISPR-Cas9で遺伝子欠損を誘導した184-hTERT乳腺上皮細胞株のDLP+解析により、BRCA1欠損が最も高い細胞間ゲノム変動を誘導することが示された (Fig. 1)。単一細胞当たりのセグメント変化数を比較したところ、BRCA1-/-細胞が中央値53イベント/cellと最高であり、BRCA2-/-細胞は30イベント/cell、BRCA1+/-細胞は6イベント/cell、BRCA2+/-細胞は6イベント/cell、TP53-/-細胞は5イベント/cell、野生型細胞は1イベント/cellと、段階的に増加した (全比較で p<10^-10)。BRCA1-/-細胞の大多数は全ゲノム重複を経験しており、ハプロタイプ特異的コピー数 (HSCN) 距離はTP53-/-細胞に対して 13.7-fold の増大を示した (Fig. 1)。TP53欠損は細胞間多様性を 3.9-fold (SA906a) または 1.9-fold (SA906b) 増大させ、BRCA2-/-は 4.5-fold (SA1055) または 2.6-fold (SA1056) 増大させた。LOH領域の比較では、BRCA1-/-が 6.3-fold (p<10^-10)、BRCA2-/-が 13.5-fold および 2.5-fold (p<10^-10) の増大を示した。
HLAMPによるクローン特異的増幅と表現型多様性: SIGNALS解析により、細胞間構造変異によって定義される3つの前景変異パターンのうち、HLAMP (高レベル増幅) が同定された (Fig. 2)。10コピー以上のクローン特異的・細胞特異的増幅であり、野生型では稀であったが、TP53欠損で増加し、BRCA1/2欠損でさらに増加した。MYC、PIK3CA、KRAS、ERBB2、CCNE1、FGFR1、KIT などの既知がん遺伝子でHLAMPが確認され、BFBCと一致するstaircase型コピー数変化パターンが観察された。FBI腫瘍はHRD-Dup腫瘍に対してHLAMPのコピー数分散が 1.9-fold 高く (p=0.00096)、HLAMPイベントの幅は56%が10 Mb未満、最大コピー数の中央値は16.1 (IQR 8.7) であった。クローン特異的 KRAS 増幅 (平均コピー数16.1、n=55 cells からなるクローン) と周辺クローン (n=230 cells、増幅なし) でscRNA-seq上の KRAS 発現差異が確認された (最大 log2FC=0.346、q<0.05) (Fig. 4)。
並行ハプロタイプ特異的変化による収束進化: 第2の前景変異パターンとして、同一総コピー数の細胞内で母系・父系アレル別々の変化が並行して起きる「並行ハプロタイプ特異的変化」が同定された (Fig. 2)。異なるアレル欠失が同一転写表現型への収束をもたらした。SA906b chr.2qでの母系・父系喪失細胞はscRNA-seq上で同一クラスターに分布し、scDNA-seqとscRNA-seqの BAF (B-allele frequency) 値が高度に相関した (R=0.91, p<10^-5) (Fig. 5)。全サンプルで少なくとも1つの並行CNA事象が存在し、クローン性セグメントの6%、サブクローン性の15%、希少な7%が並行CNAを含んでいた。FBI腫瘍はHRD-Dup腫瘍に比べてサブクローン性並行CNAの割合が高かった (p=0.02)。
セレート型構造変異によるゲノム多様化: 第3の前景変異パターンとして、細胞間でCNAブレークポイント位置が分布し、バルクWGSでは傾斜コピー数変化として現れる「セレート型構造変異 (SSV)」が同定された (Fig. 2)。セレーションスコアが0.15以上の領域は全事例で6.6%存在し、FBI症例が最も高率 (12.1%)、HRD-Dup症例が最低 (1.2%)、TD症例が中間 (10.5%) であった (Fig. 6)。SSVはFBI症例でHRD-Dupより有意に高い値を示した (p=0.0081、混合効果線形モデル)。serial passingで持続的にSSVが蓄積することも確認された。
患者腫瘍における前景パターンと臨床的予後: MMCTM分類により患者腫瘍は、HRD-Dup、HRD-Del、FBI、TD の4グループに分類された。HGSC 170例のコホートでの生存解析では、HRD-Delが最良、HRD-Dup・FBI・TDと順に不良な中央生存期間を示した (p=0.0038、p=0.0022) (Fig. 3)。FBI腫瘍はHRD-Dup腫瘍に対してゲイン/ロス比が4.9対2.1 (p=0.04)、多倍体細胞の割合が有意に高く (p=0.02)、染色体分配異常率も高かった (p=0.0015) (Fig. 3)。細胞間HSCN距離の中央値はサンプル間で大きく異なり、TDの二倍体症例 SA1047 では2から五倍体FBI症例 SA604 では123超まで変動した。FBI腫瘍の平均HSCN距離 (71) はHRD-Dup (46) およびTD (26) より高かった (p=0.047 FBI vs HRD-Dup, p=0.031 FBI vs TD)。これらの結果は、FBI腫瘍がHRD-Dup腫瘍と比較して、単一細胞レベルで著しく異なるCNA蓄積パターンを示すことを明確に示している。
考察/結論
先行研究との違い: 本研究は、スケール化単一細胞WGS (DLP+) とハプロタイプ特異的解析アルゴリズム SIGNALS を組み合わせることで、バルクシーケンスでは不可視であった細胞間構造変異の「前景」パターンを初めて体系的に同定・定量化した。このアプローチは、従来のバルクWGSに基づく平均的なゲノム解析アプローチと異なり、個々の細胞が持つ独自の構造変異をリアルタイムで追跡することを可能にした。合計 n=13818 cells の細胞株ゲノムと n=22057 cells の患者腫瘍ゲノムという大規模な解析は、これまでの単一細胞WGS研究を大幅に上回り、変異プロセス種別間の定量的比較を初めて可能にした。これまでの研究では、細胞外DNA増幅の定義的な特徴としてHLAMPの振幅変動が認識されていたが (Verhaak et al. NatRevCancer 2019)、本研究はそれと対照的に、BFBCや複雑な染色体間再編成によって媒介される他のクラスのHLAMPsにおいても、細胞間でその振幅が大きく変動する普遍的な特性であることを初めて示した。また、バルクWGSでは見かけ上「平均的な増幅」と見えても、実際は細胞ごとに大きく異なる振幅(最大コピー数の中央値16.1、IQR 8.7)を持つことが明らかになった。
新規性: 本研究で初めて、並行ハプロタイプ特異的変化(scDNA-seqとscRNA-seqのBAF値 R=0.91)が、収束的進化の単一細胞レベルでの証拠を提供し、正確ながん細胞分画 (CCF: cancer cell fraction) 推定を困難にする可能性を示した。特にFBI腫瘍はHRD-Dup腫瘍に比べてサブクローン性並行CNAが有意に多く (p=0.02)、FBI型HRDが特に高い進化的可塑性を持つことを示唆する。SSVは継続的変異プロセスを反映する新しいゲノム多様化機構として定義され、FBI症例でのセレーションスコア (12.1%) はHRD-Dup (1.2%) に比べ約10倍高く (p=0.0081)、変異プロセス種別のゲノム多様化様式の質的差異が明確化された。これらの知見は、これまで報告されていない細胞間ゲノム多様性のメカニズムを明らかにするものである。
臨床応用: 本知見は、FBI腫瘍でのHLAMPに基づくがん遺伝子依存性の予測(CCNE1・KRASへの依存性)、HRD/FBIの変異プロセス分類に基づく治療選択(PARP阻害薬 vs. BET阻害薬等)、そしてHGSC患者の生存予後(HRD-Del最良 vs. TD最悪、p=0.0022)との整合性を活用した層別化の精緻化に応用できる可能性があり、臨床現場での個別化医療の推進に貢献することが期待される。
残された課題: 今後の検討課題として、SSVの正確な分子機構(DNA修復との関係)、HLAMPによる免疫編集への影響、および他の腫瘍タイプへの SIGNALS パイプラインの拡張が残されている。また、本研究では細胞死の速度と真のイベント率を分離することが困難であったため、我々のイベント率は「実効イベント率」であるという limitation がある。
方法
本研究では、まず CRISPR-Cas9 を用いて TP53、TP53/BRCA1、TP53/BRCA2 欠損を誘導した 184-hTERT 乳腺上皮細胞株(計6ジェノタイプ)を樹立した。これらの細胞(合計 n=13818 cells)に対し、tagmentation単一細胞WGS (DLP+、中央値カバレッジ0.04×、IQR 0.03) を適用した。内訳は、野生型 n=878 cells、TP53-/- n=1634 cells (2ライン)、BRCA1+/- n=377 cells、BRCA1-/- n=382 cells、BRCA2+/- n=472 cells、BRCA2-/- n=887 cells (2ライン) であった。細胞ごとのCNAおよびSVの蓄積率と変異パターンを推測するため、DLP+データは既存のパイプラインで処理された。
ハプロタイプ特異的CNA解析のため、本研究では新規のHMMベースのアルゴリズム SIGNALS を開発した。SIGNALSは、単一細胞ゲノムにおけるコピー数イベントを個々の相同染色体にフェーズ分けし、ハプロタイプ特異的CNAを定量化する。この方法は、卵巣がん細胞株である OV2295 を用いてベンチマーク検証され、0.5 Mbの解像度で細胞間多様性を同定できることが示された。
患者コホートとしては、170例のHGSCと139例のTNBCからなる合計309例の「メタコホート」を構築した。このうち106例のTNBCと22例のHGSCは本研究で新規にシーケンスされた。バルク腫瘍-正常ペアWGSデータを用いて、機械学習コリレーテッドトピックモデル (MMCTM: multimodal correlated topic model) により既知の変異プロセス(HRD-Dup、HRD-Del、FBI、TD)に分類した。これらの分類に基づき、HRD-Dup (n=8)、TD (n=3)、FBI (n=12) の各タイプから選択された23例の患者由来異種移植片 (PDX: patient-derived xenograft) を用いて、DLP+解析を実施した。合計 n=22057 cells(中央値556ゲノム/シリーズ、中央値カバレッジ0.05×、IQR 0.05)がシーケンスされた。免疫不全マウスモデルとして NSG (NOD/SCID/IL2rγ-/-) および NRG (NOD/Rag1-/-/Il2rγ-/-) マウス株が PDX 樹立および維持に使用された。PDX由来のDLP+擬似バルクから推測された一塩基変異 (SNV: single-nucleotide variant) およびSV変異シグネチャプロファイルは、対応するバルクWGSと一致し、SIGNALSによる LOH (loss of heterozygosity) 領域の割合とバルクシーケンスとの高い相関 (Pearson correlation R=0.9, p<0.001) が確認された。
細胞のクローンは、UMAP (uniform manifold approximation and projection) と HDBSCAN (hierarchical density-based spatial clustering of applications with noise) を用いた細胞ごとのGC補正済みリードカウントプロファイルのクラスタリングにより同定された。細胞の倍数性は、HMMCopyによって決定された最も一般的なコピー数状態として計算された。染色体不分離イベントは、クローンコンセンサスプロファイルと比較した細胞のコピー数プロファイルに基づいて特定された。ゲインおよびロスセグメントは、細胞の倍数性と比較してコピー数状態が高いまたは低い連続した500kbビンとして定義された。
セレート型構造変異 (SSV: serrate structural variation) スコアは、各ブレークポイントイベントについて、稀な(5%未満の細胞で発生する)ブレークポイント位置を持つイベント含有細胞の割合として計算された。HLAMP (high-level amplification) は、少なくとも10個の細胞で10コピー以上の生コピー数を持つ500kbゲノムビンとして定義された。HLAMPのコピー数分散は、細胞の倍数性と細胞クローンで調整された生コピー数を用いて計算された。
系統樹解析は sitka を用いて実施され、細胞間のコピー数変化点の数として系統距離が計算された。全染色体、染色体腕、およびセグメント異数性のゲインおよびロスのイベント率は、パースィモニーベースの祖先状態再構築を用いて単一細胞系統樹から推定された。コピー数距離は、あるコピー数プロファイルを別のコピー数プロファイルに変換するために変更する必要があるセグメントの数として計算され、全ゲノム重複を考慮して修正された。統計的比較には、Wilcoxon rank sum test、log-rank test、混合効果線形モデル、および Spearman correlation などが用いられた。