- 著者: Navin N, Kendall J, Troge J, Andrews P, Rodgers L, McIndoo J, et al.
- Corresponding author: Michael Wigler; James Hicks (Cold Spring Harbor Laboratory)
- 雑誌: Nature
- 発行年: 2011
- Epub日: N/A
- Article種別: Original Article
- PMID: 21399628
背景
腫瘍内遺伝的不均一性 (intratumor heterogeneity: ITH) は、がんの治療抵抗性や転移、予後予測において極めて重要な要素である。これまで、バルクシークエンシングやアレイCGH (comparative genomic hybridization) といった技術がITHの存在を示唆してきたが、これらの手法は混合細胞集団の平均的なゲノムプロファイルを提供するに過ぎず、個々の細胞が持つ遺伝的変異を直接的に観察することは困難であった。このため、腫瘍の進化が「漸進的・段階的なモデル (gradual progression)」に従うのか、あるいは「断続的クローナル拡大モデル (punctuated clonal expansion)」に従うのかという根本的な問題は未解明であり、進化ダイナミクスの解明には至っていなかった。漸進的モデルでは、各変異が時間とともに段階的に蓄積し、多様な中間体細胞が豊富に存在することが予測される。これに対し、断続的クローナル拡大モデルでは、少数の急激なクローナル拡大が腫瘍増殖の主要な駆動力となり、中間体は比較的希少であると想定される。この違いは、がんの発生と進行のメカニズムを理解する上で極めて重要である。
さらに、転移のクローナル起源についても不明な点が多かった。転移巣が単一のクローンに由来するのか、それとも複数の異なるクローンが転移能を獲得して播種するのかは、転移性疾患の治療戦略を策定する上で重要な情報である。転移播種に必要な特定の遺伝的特性を持つ細胞を同定することは、がん治療における長年の課題であった。従来のバルク解析では、このような特定の細胞集団を分離して解析することが技術的に困難であったため、転移能を持つクローンの特定は進んでいなかった。例えば、Nowell (1976) は腫瘍細胞集団のクローナル進化を提唱したが、その詳細なメカニズムは細胞レベルでは未解明であった。また、Langmead et al. GenomeBiol 2009 のような次世代シークエンシング技術は発展途上にあり、単一細胞レベルでのゲノム解析に応用するには技術的な課題が残されており、ゲノム情報を高解像度で取得するための手法が不足していた。Farabegoli et al. (2001) の研究ではFISH (fluorescence in situ hybridization) を用いて乳癌のクローン異質性を検出したが、これも単一細胞レベルでの詳細なゲノム構造を解明するには不足していた。
これらの未解明な問題に対し、単一細胞解析技術の確立は革命的なアプローチとして期待されていた。個々の細胞レベルでゲノム情報を直接取得することで、腫瘍内の細胞多様性を詳細に解明し、腫瘍進化の動態や転移のメカニズムに関する直接的な証拠を提供できる可能性を倍増させる。本研究は、この技術的ギャップを埋め、腫瘍進化の新たなパラダイムを提唱することを目的とした。特に、乳癌におけるITHの複雑性を解き明かし、腫瘍の増殖と転移におけるクローナルダイナミクスを明らかにすることが強く求められていた。しかしながら、単一細胞から高精度かつ高解像度でゲノム全体のコピー数プロファイルを定量化する技術は未確立であり、ゲノム増幅時のバイアス補正技術の不足が大きな課題として残されていた。
目的
本研究の目的は、フローサイトメトリーによる個別核単離、WGA (whole genome amplification) としての全ゲノム増幅、および次世代シークエンシングを組み合わせた新規の単核シークエンシングである SNS (single-nucleus sequencing) 法を開発し、その性能を検証することである。このSNS法を用いて、乳癌の単一細胞ゲノムコピー数プロファイルを高解像度で取得し、以下の点を直接的に推定することを目的とした。第一に、腫瘍内のクローナル構造と細胞集団の多様性を明らかにする。第二に、腫瘍が漸進的ではなく断続的なクローナル拡大によって進化するという仮説を検証する。第三に、一次腫瘍と転移巣におけるクローナルな関係性を解明し、転移の起源が単一クローンであるか否かを判断する。最終的に、これらの知見を通じて、がんの進化メカニズムに関する新たな理解を確立し、将来的な診断・治療戦略開発の基盤を提供することを目指した。
結果
SNS法のバリデーションと高解像度コピー数プロファイリング: 乳癌細胞株である SK-BR-3 を用いたSNS法のバリデーションでは、単一細胞のコピー数プロファイルが百万細胞のバルクプロファイルと非常に高い相関 (r² > 0.85) を示すことが確認された (n=7 single cells vs. bulk million cells)。MYC (8q24)、TPD52 (8q21)、ERBB2 (17q12)、BCAS1 (20q13) の増幅やDCC (18q21) の欠失といった主要なゲノム異常が、単一細胞とバルク細胞の両方で一貫して検出された (Figure 1)。特に、染色体8q13.2-q24.23上の30以上の異なるコピー数セグメントを含む複雑な領域においても、単一細胞レベルで高い再現性が示された (Figure 1c, d)。ビンあたりの平均リード密度は138 ± 5.55 (SEM, n=200 bins) であり、54 kbの解像度で正確なコピー数定量が可能であった。正常ヒト線維芽細胞 SKN1 の単一細胞プロファイルでは、一貫したゲノム異常は観察されず、観察された希少なイベントは遺伝性CNV (copy number variation) に帰属可能であり、SNS法の高い特異性が確認された (Figure 1f)。
ポリゲノミック腫瘍T10の倍数体分布と細胞組成: ポリゲノミック腫瘍T10のFACS解析では、4種類の倍数体分布 (F1〜F4) が観察された (Figure 2a)。F1は低二倍体 (hypodiploid) で区域S1-S3に限定され、F2は二倍体 (2N) で全区域に分布、F3およびF4は亜四倍体 (subtetraploid) で区域S4-S6に存在した。組織病理学的評価により、T10は63%が正常細胞、37%が腫瘍細胞であり、顕著な白血球浸潤が認められた。FACSのF2分画(二倍体核)の細胞のうち、31/47 (66%) がT細胞受容体遺伝子座または免疫グロブリン可変領域に狭小欠失を有しており、これらが浸潤白血球(免疫細胞)であることが確認された。残りの16個のF2核のうち、12個は明らかなゲノム異常を示さなかったが、4個の核は多様な染色体獲得・喪失を伴う異常プロファイルを示し、これらは後述の「偽二倍体」細胞として分類された。
T10における4分岐・5サブ集団のクローナル構造: T10から解析した100個の単一細胞コピー数プロファイルからペアワイズ距離を算出し、近傍結合法で構築した系統樹は、4つの主要な分岐を示した (Figure 2b)。クラスター解析により、5つのサブ集団 (D+P=二倍体+偽二倍体、H=低二倍体、AA、AB) が定義された。H、AA、ABの3つの主要な腫瘍サブ集団はそれぞれ高度にクローナルであり、共通する多数のゲノム変化を持ちながらも独自の特性を有していた。特に、ABサブ集団はKRASがん遺伝子の 50-fold amplification (50倍増幅) という特徴的なゲノム異常を持ち (p<0.001)、これは他のサブ集団には存在しなかった。Hサブ集団は「鋸歯状」パターン (sawtooth pattern: 広域染色体欠失が交互に並ぶ) を示し、解剖学的に区域S1-S3に限局していた。一方、AAとABサブ集団は区域S4-S6に混在していた。657個のコピー数ブレークポイントを用いた系統樹解析でも、近傍結合樹の構造と一致する結果が得られ、共通祖先から3回の連続的なクローナル拡大が生じたモデルが示唆された。
モノゲノミック腫瘍T16Pと転移巣T16Mの解析: モノゲノミック腫瘍T16Pから n=52 cells、その肝転移巣T16Mから n=48 cells をそれぞれ3区域から単離し、合計 n=100 cells をSNSで解析した。T16PとT16Mの両方で、FACS解析により2種類の倍数体分布 (F1=低二倍体、F2=二倍体) が観察された (Figure 3a, b)。100個の単一細胞を用いた近傍結合樹の解析では、T16P (一次腫瘍) とT16M (肝転移) の細胞が同一のクローナル集団に属することが明確に示された (Figure 3c)。一次腫瘍と転移巣の異数体コンセンサスコピー数プロファイルは高い類似性を示し (Figure 3d)、転移が単一のクローナル拡大に由来することを強く示唆した。これは、転移播種における「クローナルなボトルネック」の存在を裏付ける重要な証拠である。
偽二倍体集団の発見と転移非寄与の証拠: 両腫瘍において、コピー数プロファイルが二倍体に見えるが、実際には多数の不均衡なゲノム変化を持つ「偽二倍体 (pseudodiploid)」細胞が予想以上に豊富に存在することが明らかになった (Figure 4)。T10では、二倍体F2分画の16細胞(免疫細胞以外)のうち n=4 cells (25%) が偽二倍体であり、これらの偽二倍体プロファイルは互いに、また主要な腫瘍サブ集団とも異なる多様なゲノム変化を示した。T16Pでは、36個の二倍体細胞のうち n=12 cells (33%) が偽二倍体であった。決定的な知見として、偽二倍体細胞は転移巣T16Mには存在せず、一次腫瘍T16Pにのみ残存していた (Figure 4c, d)。このことは、偽二倍体細胞集団が転移播種に寄与しない可能性を示唆しており、「転移能を持つクローンは特定の遺伝的特性を必要とする」という概念を支持する。偽二倍体細胞は、腫瘍内でゲノム多様性を生み出す進行中の異常なプロセスから生じる可能性が示唆された。
腫瘍進化モデル:漸進的ではなく断続的クローナル拡大: 両症例のデータを総合すると、腫瘍が各変異を漸進的に蓄積する従来のモデルでは説明できない進化パターンが示された。各クローナル拡大の間に存在するはずの「中間体」細胞が豊富には存在せず、腫瘍は少数の急激なクローナル拡大 (punctuated clonal expansions) によって成長するというモデルが強く支持された。このモデルでは、各クローン拡大の間に比較的長い「静止期」が存在し、この期間中に単一細胞あたりの変異蓄積が進むが、適切な変異セットが揃った時点で急速なクローナル拡大が生じると考えられる。これは、がん進化がほぼ連続的であるとする従来の漸進的モデルと対比される新たなパラダイムであり、種進化における断続平衡説に類似する。
考察/結論
先行研究との違い: これまでのバルク解析では、腫瘍内の細胞集団の平均的なゲノムプロファイルしか得られず、個々の細胞レベルでのクローナル構造や進化の動態を直接観察することは困難であった。本研究は、この限界を克服し、単一細胞レベルでゲノムコピー数プロファイルを高解像度で取得することで、腫瘍が漸進的ではなく、少数の急激なクローナル拡大によって成長するという「断続的クローナル拡大モデル」を提唱した。この点で、従来の漸進的進化モデルとは対照的な知見を提供した。このモデルは、その後の多数の腫瘍種における単一細胞解析やクローナルダイナミクス研究により広く支持され、漸進的進化モデルとの実証的比較が継続されている。ポリゲノミック腫瘍T10では、657個のブレークポイント解析により3回のクローナル拡大が確認され、各サブ集団 (H、AA、AB) が高い内部均一性を持ちながら互いに明確に分岐していた。
新規性: 本研究で初めて、乳癌の単一細胞ゲノムコピー数プロファイルから、腫瘍の集団構造と進化パターンを直接的に推定するSNS法を開発し、その有効性を実証した。特に、転移巣が単一クローンに由来するという観察 (T16P vs. T16M: 各n=100 cells、r²相関による一致) は、すい臓がんや前立腺がんなどでも後に確認されており、転移播種における「クローナルなボトルネック」の存在を示す重要な新規証拠となった。さらに、コピー数プロファイルが二倍体に見えるが実際には多様なゲノム変化を持つ「偽二倍体」細胞の発見と、それらが転移巣には存在しないという示唆は、転移能を規定する遺伝的特性の同定という新たな研究方向性を提供した。
臨床応用: 本研究の知見は、がんの診断と治療戦略に重要な臨床的含意を持つ。転移播種には特定の遺伝的特性を持つクローンが選択されることが示されたことで、転移予防を目的とした分子標的の同定、および液体生検による転移性クローンのモニタリングという研究方向性が確立された。また、腫瘍内の多様なクローン集団を単一細胞レベルで解析する能力は、個別化医療の推進において極めて有用である。特定のクローンが薬剤耐性を獲得するメカニズムの解明や、治療抵抗性クローンの早期検出にも応用可能であり、臨床的有用性は極めて大きい。
残された課題: 今後の検討課題として、SNS法のさらなる高スループット化と、点変異やエピゲノム解析への応用が挙げられる。本研究では約6%のゲノムカバレッジであったが、より深いカバレッジで点変異を検出する技術開発が求められる。また、単一細胞マルチオミクス解析との統合により、ゲノム、トランスクリプトーム、エピゲノムの相互作用を細胞レベルで解明することが今後の方向性である。Limitationとしては、解析した腫瘍症例数が2例と少ないため、本研究で提唱された断続的クローナル拡大モデルが他の腫瘍種やより大規模なコホートで普遍的に当てはまるかどうかの検証が必要である。また、偽二倍体細胞の生物学的機能や、なぜ転移に寄与しないのかというメカニズムの解明も残された課題である。
方法
SNS法の確立と最適化: 本研究では、フローサイトメトリーによる個別核単離、WGA、および次世代シークエンシングを組み合わせた単核シークエンシング (SNS) 法を開発した。具体的には、まず細胞培養または凍結腫瘍組織から核を単離し、DAPI (4’,6-diamidino-2-phenylindole) で染色した。その後、BD Biosystems Aria II フローサイトメーターを用いて、総DNA含有量(倍数性)に基づいて目的の核集団をゲーティングし、96ウェルプレートの各ウェルに単一核を分注した。WGAはSigma GenomePlex WGA4キットを用いて実施した。増幅されたDNA断片は、Illumina Genomic DNA Sample Prep Kitを用いてライブラリを構築し、Illumina GA2アナライザーで76 bpのシングルエンドシーケンスを行った。各核から平均904万 (s.e.m. ± 0.328, n=200 cells) のユニークマッピングリードを取得し、これはゲノムの約6% (平均5.95%, s.e.m. ± 0.229, n=200 cells) をカバーする。リードのアライメントにはBowtieソフトウェア Langmead et al. GenomeBiol 2009 を使用した。
コピー数定量とバイアス補正: コピー数定量のため、ゲノムを可変長ビンに分割し、各ビン内のユニークリード数をカウントした。従来の固定長ビンとは異なり、本研究ではシミュレーションにより、ゲノムのマップ可能性に応じてビンサイズを調整する可変長ビンを採用した。これにより、WGAで報告されるバイアス(例えば、反復配列領域でのリード数減少)を補正し、ビンあたりのユニークリード期待カウント数を均一化した。結果として、50,009個のゲノムビンが設定され、各ビンのゲノム長の中央値は54 kbであった。各単一細胞において、ビンあたりの平均リード密度は138 ± 5.55 (SEM, n=200 bins) と安定しており、54 kbの解像度でコピー数定量が可能であった。WGAで報告される過剰増幅ローカスである「pileup」は、本データでも観察されたが、異なる細胞間で再発する位置にはなく、54 kbの解像度での計数に影響しない程度に希少かつランダムに分布することを確認した。
コピー数プロファイルのセグメンテーションと整数コピー数推定: ユニークリードカウントは、Kolmogorov-Smirnov (KS) 統計量を用いてセグメント化された。セグメント間のコピー数状態の整数差を推定するため、Splus (MathSoft) を用いてガウスカーネル平滑化密度プロットを作成し、異なるセグメントのメディアンビンカウント間の差を解析した。これにより、単一細胞データに特有の均一なステップが明確に観察された。KSセグメント化されたデータは、この「コピー数増分」に基づいて整数コピー数プロファイルに変換された。アレイCGHとの比較では、SNS法で得られたコピー数プロファイルは高い相関 (r² > 0.85) を示した。
解析対象と系統解析: SNS法のバリデーションには、乳癌細胞株である SK-BR-3 (7単一細胞 + 百万細胞) および正常ヒト線維芽細胞である SKN1 (7単一細胞 + 百万細胞) を使用した。主要解析では、2症例の乳癌を選択した。1例目 (T10) は、グレードIII、トリプルネガティブ (ER-/PR-/HER2-) の浸潤性乳管癌で、遺伝的に不均一 (ポリゲノミック) であることが既報であった。T10は解剖学的情報を保持するため12区域にマクロ解剖され、そのうち6区域 (S1-S6) から核を単離した。2例目 (T16P) は、グレードIII、トリプルネガティブの一次腫瘍で、遺伝的に均一 (モノゲノミック) と分類されていた。これに対応する肝転移巣 (T16M) も解析対象とした。T16Pからは52核、T16Mからは48核をそれぞれ3区域から単離した。
各症例から得られた100個の単一細胞コピー数プロファイルから、ペアワイズ距離を算出し、近傍結合法 (neighbor-joining method) を用いて系統樹を構築し、クローナル集団を定義した。さらに、657個のコピー数ブレークポイントを同定し、これらを用いて追加の系統樹解析とbiclusteringを実施し、クローナルな関係性を詳細に解析した。遺伝子アノテーションは、UCSC遺伝子およびがん遺伝子データベース (cancer gene consensus, NCI cancer gene index) を用いて実施した。統計解析には、Kolmogorov-Smirnov (KS) 統計量を用いたセグメンテーションや、近傍結合法による系統樹構築、Splus (MathSoft) を用いたガウスカーネル平滑化密度プロットの作成が含まれる。また、2群間の連続変数の比較において、ノンパラメトリックな統計手法として Mann-Whitney U test を用いて有意差の評価を行った。