- 著者: Marc J. Williams, Benjamin Werner, Chris P. Barnes, Trevor A. Graham, Andrea Sottoriva
- Corresponding author: Trevor A. Graham (Queen Mary University of London); Andrea Sottoriva (The Institute of Cancer Research, London)
- 雑誌: Nature Genetics
- 発行年: 2016
- Epub日: 2016-01-18
- Article種別: Original Article
- PMID: 26780609
背景
腫瘍内不均一性 (ITH) は、がん進化の理解と治療抵抗性予測において中心的な課題であり続けている。次世代シークエンシング (NGS) によるがんゲノム解析が進む一方で、得られたデータを進化ダイナミクスの観点から解釈するための厳密な理論的枠組みが不足していた。特に、観察されたITHのうちどの程度が機能的な選択圧により駆動されるものであり、どの程度がランダムな「パッセンジャー変異」の蓄積 (中立進化) によるものであるかを判別するための「null model」が存在しなかった点は、がん研究における重要な知識ギャップであった。このギャップは、ITHの臨床的意義を正確に評価する上で大きな障害となっていた。
集団遺伝学では、中立進化の概念がLuria-Delbrückモデル (細菌の変異動態) として確立されており、拡大する細胞集団での変異蓄積パターンを記述する理論が整備されていた。しかし、この理論をヒトのがん進化に直接適用し、バルクシークエンシングデータからそのパターンを検出する試みは限定的であった。著者らは、この理論をがん進化に適用することで「腫瘍のバルクシークエンシングデータで観察されるサブクローナル変異アレル頻度 (MAF) の分布が、中立進化に特徴的な1/fべき乗分布に従うかどうか」をテストできると着想した。大腸癌の先行研究である Sottoriva et al. NatGenet 2015 では、腫瘍が単一の「Big Bang」的拡大をとることが示唆されており、このモデルの適用対象として適切であると考えられた。また、Gerlinger et al. NEnglJMed 2012 や Navin et al. Nature 2011 といったマルチリージョンシークエンシング研究によりITHの複雑性が明らかになる一方で、その機能的意義の解釈は未解明な部分が多く、中立進化の寄与を定量的に評価するモデルが不足していた。本研究は、この理論的枠組みの不足を解消し、がんの進化ダイナミクスをより深く理解するための基盤を提供することを目的とした。これまでの研究では、腫瘍進化は強い選択圧によって駆動されるという見方が主流であったが、その仮説を裏付ける厳密な数理モデルの構築と、大規模なゲノムデータセットへの適用は手薄であった。特に、サブクローナル変異の頻度分布を中立進化の観点から解析し、その適合度を定量的に評価する手法は、これまで確立されていなかった点が重要な課題であった。
目的
本研究の目的は、腫瘍の中立進化を同定するための数学モデル (サブクローナル変異の累積分布M(f)が1/fに比例するという予測) を開発し、これを14がん種にわたる大規模コホートに適用することで、以下の3点を達成することである。(1) 中立的に進化する腫瘍の割合を定量化すること、(2) このモデルを用いてin vivo変異率を患者ごとに計測すること、(3) 変異が生じた腫瘍増殖時点を推定する「変異タイムライン」の再構築を実現すること。これにより、既存のがんゲノムデータを進化論的観点から再解釈し、機能的ITHと非機能的ITHを区別する新たな方法を提供することを目指した。中立進化モデルを適用することで、腫瘍の増殖ダイナミクス、変異の蓄積速度、および主要なドライバー変異の発生時期に関する、これまでアクセス不可能であった情報を単一のバルクシークエンシングデータから引き出すことを意図した。このアプローチは、がんの進化における選択と中立性の相対的寄与を明確にし、ITHの臨床的意義をより正確に評価するための基盤を築くことを目指す。
結果
中立進化の頻度とがん種間差: 自施設7例とTCGA大腸癌101例の合計108例のうち、38例 (35.1%) がR²≥0.98の高適合度で中立進化モデルに合致した (Fig. 1c)。染色体不安定性 (CIN) を持つ腫瘍では31/82例 (37.8%) が中立進化を示したのに対し、マイクロサテライト不安定性 (MSI) 腫瘍では3/19例 (15.7%) と低率であり、MSI腫瘍では強い選択圧が働いている可能性が示唆された。R²値は変異カバレッジの平均 (p=0.32)、変異総数 (p=0.40)、モデル範囲内の変異数 (p=0.65) のいずれとも独立しており、シークエンス品質による偏りを否定した。パンキャンサー解析では、14がん種819例中259例 (31.6%) がR²≥0.98で中立進化に適合した (Fig. 3a)。中立進化が多かったがん種は胃癌、肺癌、膀胱癌、子宮頸癌、大腸癌であった。一方、腎癌、黒色腫、膵臓癌、甲状腺癌、膠芽腫では中立適合率が低く、強い継続的な選択圧が働いていることが示唆された。これは、腎癌で観察された収束進化の報告 Gerlinger et al. NEnglJMed 2012 とも整合する。
in vivo変異率の計測と変異シグネチャー: 中立進化が成立した腫瘍でM(f)の傾きから有効変異率µeを算出すると、大腸癌CIN群の中央値µe = 2.31×10⁻⁷に対し、MSI群は中央値µe = 3.65×10⁻⁶と約15倍高値であった (F検定 p=2.24×10⁻⁸) (Fig. 1d)。これはMSI腫瘍のDNAミスマッチ修復欠損と生物学的に一致する。変異種類別ではC>T変異が中央値µe,C>T = 2.19×10⁻⁷と他のどの変異種別より約10倍高率であった (F検定 p=3.13×10⁻³)。パンキャンサー解析では、最高が肺腺癌 (中央値µe = 6.79×10⁻⁷)、肺扁平上皮癌 (中央値µe = 5.61×10⁻⁷) であり、最低が低悪性度グリオーマ (中央値µe = 9.22×10⁻⁸) と前立腺癌 (中央値µe = 1.04×10⁻⁷) であった (Fig. 3b)。これはがん種間で1桁以上の変異率差があることを意味する。C>A変異は肺癌で著しく高率であり、肺腺癌 (p=2.72×10⁻¹⁶) および肺扁平上皮癌 (p=3.90×10⁻⁴) ともに有意であったことは、タバコ煙由来の発がん変異シグネチャーと完全に一致する Helleday et al. NatRevGenet 2014。C>T変異は複製エラーに関連するため、がん種を問わず最も一貫した変異率を示した。
胃癌での全ゲノムレベルでの中立進化: 高深度WGSを用いた胃癌78例では60/78例 (76.9%) が中立進化に適合し、大腸癌より高率であった (Fig. 2c)。このパターンはコーディング領域・非コーディング領域ともに一貫して認められ、全SNVs・エクソニックSNVs・非コーディングSNVsのいずれで判定しても同一腫瘍が中立と判定された。MSS胃癌では57/68例 (83.8%) が中立進化を示したが、MSI胃癌では3/10例 (30%) のみであった。胃癌での変異率はMSI群 (µe = 3.30×10⁻⁶) がMSS群 (µe = 7.82×10⁻⁷) の4倍以上であった (F検定 p=1.35×10⁻⁴) (Fig. 2d)。WGSの方がWESより中立検出率が高い理由として、ゲノム全体を使えば検出できる変異数が増え、厳格なR²≥0.98閾値を満たしやすくなることが指摘されている。
変異タイムラインの再構築: 中立進化が成立する腫瘍では、変異アレル頻度fから「変異が発生した時点での腫瘍サイズ」を逆算できる。大腸癌サンプルTBおよびTCGA-AA-3712の解析では、APC、KRAS、TP53などの古典的大腸癌ドライバー変異は第一がん細胞の時点から存在していたことが確認された (Fig. 4)。一方、一部の候補ドライバー変異は中立進化フェーズ (腫瘍拡大後) に生じており、これらは文脈依存的に選択的優位性を持たないパッセンジャー変異である可能性が示唆された。本手法は単一生検サンプルから変異タイムラインを推定でき、マルチリージョンサンプリング等の高コスト手法を代替する可能性がある。
in silicoバリデーション: 確率論的シミュレーション (n=10,000 simulations) では、正常細胞汚染30%以下、シークエンス深度変動、検出下限 (アレル頻度>10%)、変異率変動などの現実的ノイズ下でもモデルが変異率を平均誤差1.1%・95%シミュレーションで15%以内の精度で正確に回復できることが示された (Supplementary Fig. 9g, 10)。高正常汚染 (>30%) では精度が低下するため、腫瘍純度≥70%という閾値の妥当性が数値的に検証された。選択圧を持つ第2のクローンが存在するシミュレーションでは中立べき乗則から逸脱することが確認され、モデルの鑑別能の高さが示された (Supplementary Fig. 11a, b)。また、複数のクローンクラスターが存在する場合や、腫瘍増殖初期に変異率が著しく増加する場合にも、中立べき乗則からの逸脱が観察された (Supplementary Fig. 11c-h)。これらのシミュレーションは、モデルが幅広い条件下でロバストであることを示し、特に正常細胞汚染が30%を超える場合に精度が著しく低下することが示されたため、腫瘍純度70%以上のサンプルに限定した解析の妥当性を裏付けている。
考察/結論
本研究は、腫瘍の進化ダイナミクスを解釈するための初の厳密な理論的枠組みを提供し、「がんのかなりの割合が中立進化に従う」という重要な発見を大規模コホートで実証した先駆的研究である。14がん種904腫瘍にわたり約31~37%の腫瘍が中立進化モデルに適合するという結果は、腫瘍内不均一性の主要な成分がパッセンジャー変異の蓄積 (選択を受けない中立変異) によることを示しており、「ITHのほとんどは選択的ドライバーが主導する」という従来の見解を修正するものとして高い意義がある。
先行研究との違い: これまでの研究では、腫瘍進化は強い選択圧によって駆動されるという見方が主流であったが、本研究の結果は、多くのがんにおいて中立進化が主要な役割を果たすことを示し、この見方と対照的である。例えば、Gerlinger et al. NEnglJMed 2012 が腎癌で報告した収束進化は、本研究で腎癌が非中立進化が多いという結果と整合する。一方、肺癌での中立進化の高頻度は、deBruin et al. Science 2014 や Zhang et al. Science 2014 の多領域サンプリング研究での知見とも一致する。中立進化が確認された腫瘍のクローン系統樹はフラクタル的なトポロジーを持ち、腫瘍の異なる部位をサンプリングしても同一の1/f分布が観察される。著者らは腫瘍の細胞アーキテクチャ (例:腸管の腺管構造) が中立進化を促進する可能性、および腫瘍微小環境の均質性・不均質性が中立/非中立の分類に影響する可能性を論じた。また、細胞可塑性 (epigenetic変化によるフェノタイプ変化) が中立進化腫瘍での適応メカニズムとなりうるという新規仮説も提案された。
新規性: 本研究で初めて、単一のバルクシークエンシングデータから患者固有のin vivo変異率を計測し、変異の発生タイミングを推定する「変異タイムライン」を再構築する手法を確立した。これは、これまでマルチリージョンサンプリングなどの高コストな手法でしか得られなかった情報を、より簡便な方法で取得できるという点で新規性が高い。また、中立進化をがんのITHの「null model」として確立したことは、機能的ITHと非機能的ITHを区別するための新たな概念的枠組みを提供する。
臨床応用: 本知見は、がんの診断、予後予測、治療個別化に大きな臨床的意義を持つ。第一に、単一生検データからin vivo変異率を患者ごとに計測できる新手法であり、予後予測・治療個別化への応用が期待される。第二に、変異タイムラインの再構築により腫瘍形成初期のドライバーイベントと後期の中立変異を区別でき、創薬ターゲットの優先順位付けに貢献する。第三に、治療 (選択圧) により現在は中立なクローンが耐性クローンに転化する可能性を示しており、「ドライバーは文脈依存」という重要な概念的枠組みを提供する。第四に、中立進化を示す腫瘍はITHが高くても機能的クローンが限定的であるため、免疫療法等の反応予測に新たな視点を与える可能性がある。
残された課題: 今後の検討課題として、単生検データの限界 (シークエンス深度に依存する極低頻度クローンの検出困難)、腫瘍微小環境の空間的不均一性や低酸素領域が中立/非中立分類に与える影響の定量的評価、転移・治療後のダイナミクスへのモデル拡張が挙げられる。特に、正常細胞汚染が30%を超えるとモデルの精度が低下する点はlimitationであり、より高純度な腫瘍サンプルの確保や、汚染補正アルゴリズムの改善が求められる。また、中立進化と分類された腫瘍においても、微細な選択圧が作用している可能性があり、その検出にはさらなる高深度シークエンシングやシングルセル解析が必要となる。
方法
理論モデルの構築: 単一細胞から指数増殖する腫瘍において、サブクローナル変異がアレル頻度fを持つ場合、中立進化下での累積変異数M(f)はM(f) ∝ µ/f (µ: 有効変異率) と表されることを数学的に導出した。このモデルは1/fべき乗則に従い、M(f)を1/fに対してプロットした際の直線性をR²適合度 (閾値R²≥0.98) で評価することで中立進化の判定が可能となる。このモデルは、細胞死や分化により全ての細胞分裂が2つの生存する子孫細胞を生み出すわけではないことを考慮し、有効分裂率βを導入することで、有効変異率µe = µ/βとして定義される。このµeはM(f)の傾きとして直接測定可能である。
適用コホート: 本研究では、複数の大規模コホートのゲノムデータを用いた。
- 自施設大腸癌7例 (multi-region WES)
- TCGA大腸癌101例 (WES、腫瘍純度≥70%)
- 胃癌78例 (高深度WGS、腫瘍純度≥70%)
- 14がん種TCGA 819例 (WES、腫瘍純度≥70%)
変異検出とフィルタリング: 大腸癌コホートのWES解析ではMutect Cibulskis et al. NatBiotechnol 2013 を、胃癌WGSデータはVarScan2を用いて変異を同定した。TCGAの非大腸癌サンプルは、Andor et al. NatMed 2016 で記述されたパイプラインに従いMutectで変異を検出した。MSIステータスはMSIsensorを用いて判定された。変異のアノテーションにはANNOVAR Wang et al. NucleicAcidsRes 2010 を使用した。解析にはアレル頻度範囲 [0.12, 0.24] を用い、コピー数変化領域を除外した二倍体領域のみを使用した。この範囲は、低頻度変異の信頼性の高い検出限界 (約10%) と、腫瘍純度を考慮したクローナル変異のフィルタリングを考慮して設定された。腫瘍純度≥70%のサンプルのみを対象とし、モデル範囲内に少なくとも12個の信頼性の高いサブクローナル変異を持つサンプルを解析した。
統計解析とシミュレーション: M(f)の適合度はR²値で評価され、R²≥0.98を中立進化の閾値とした。確率論的シミュレーション (腫瘍を10,000シミュレーション) を実施し、正常細胞汚染 (最大30%まで)、シークエンス深度変動、検出下限 (アレル頻度>10%)、変異率変動などの現実的ノイズ下でのモデルのロバスト性を検証した。シミュレーションでは、平均誤差1.1%で変異率を回復できることが示された。選択圧を持つ第2のクローンが存在するシミュレーションでは、中立べき乗則からの逸脱が確認され、モデルの鑑別能の高さが示された。コピー数変化の影響を評価するため、SNPアレイデータを用いてコピー数変化領域内の体細胞変異を除外し、二倍体領域のみで解析を再実施した。統計的比較にはF検定を使用し、p値が0.05未満を有意とした。シミュレーションでは、A549細胞株の増殖モデルを参考に、細胞分裂時の変異率をポアソン分布でモデル化し、各細胞の系統を追跡した。