- 著者: David G. McFadden, Katerina Politi, Arjun Bhutkar, Tyler Jacks, Harold Varmus
- Corresponding author: David G. McFadden (UT Southwestern Medical Center) / Tyler Jacks (MIT) / Katerina Politi (Yale University)
- 雑誌: Proceedings of the National Academy of Sciences
- 発行年: 2016
- Epub日: 2016-09-06
- Article種別: Original Article
- PMID: 27702896
背景
遺伝子操作マウスモデル (genetically engineered mouse model; GEMM) は、肺腺癌の生物学、治療反応、および耐性機序を研究するための重要なツールとして広く利用されてきた。特に、EGFR L858R、KrasG12D、MYC過剰発現をドライバーとするGEMMは、ヒト肺腺癌の組織学的・分子的特徴を再現し、標準的化学療法や分子標的薬に対する反応・耐性パターンもヒト腫瘍と類似することが報告されている (例: DuPage et al. NatProtoc 2009、Politi et al. Genes Dev 2006)。これらのモデルは、ヒトがんゲノムの大規模シーケンス研究で同定された新規ドライバー変異の機能的評価において、その重要性を増している。
しかし、2016年時点において、これら主要なGEMMにおける体細胞変異の全体像(変異頻度、変異スペクトラム、既知がん遺伝子への変異集積など)は包括的に特性化されていなかった。特に、付加的な遺伝子変化を導入して腫瘍生物学を研究する「additive engineering approach」が増加する中で、「ベースとなるGEMM自体がどの程度の体細胞変異を自然獲得しているか」を定量的に把握することは、実験設計と結果解釈に不可欠な情報であった。例えば、腫瘍内の変異体細胞集団の異質性 (intratumor heterogeneity) やネオアンチゲン産生量は、GEMM由来の変異頻度に依存するため、免疫療法研究へのGEMM利用の前提として、その変異景観の定量化が強く求められていた。この点において、これまでの研究ではDNAコピー数変化のスペクトラムが報告されてきたが、体細胞点変異の包括的な解析は不足しており、その全体像は未解明な状態であった。
ヒト肺腺癌では、喫煙歴の有無により変異頻度が大きく異なることが知られている。喫煙者関連腫瘍は高頻度の変異を有し、ドライバー変異の特定を困難にする一方、非喫煙者関連腫瘍は比較的低い変異頻度を示す (例: Govindan et al. Cell 2012、Imielinski et al. Cell 2012)。GEMMは発がん物質への曝露がないため、ヒトの非喫煙者肺腺癌に近い変異プロファイルを示すことが期待されるが、その具体的な変異負荷やスペクトラムは未解明な点が多かった。また、腫瘍抑制遺伝子であるTrp53の欠損が変異頻度に与える影響についても、GEMMにおける系統的な解析は不足していた。これらの背景から、GEMMの体細胞変異景観を詳細に解析し、ヒト腫瘍との比較を行うことは、モデルの適切な利用と、がんの遺伝的進化の理解を深める上で重要な課題であった。
目的
本研究の目的は、EGFR L858R、KrasG12D(複数モデル)、およびMYC過剰発現を主要ドライバーとする遺伝子改変マウスモデル (GEMM) から得られた肺腺癌腫瘍および細胞株に対し、全エクソームシーケンス (WES) を実施することである。独自に最適化したマウスバリアントコーリングパイプラインを用いて、体細胞点変異の頻度、変異スペクトラム、既知がん遺伝子への変異集積、および染色体コピー数変化をモデル間で比較解析する。これにより、GEMMの遺伝的複雑性を定量的に明らかにし、ヒト肺腺癌腫瘍との体細胞変異景観の相違点を明確にすることを目指す。特に、強力なドライバー遺伝子によって誘導される腫瘍がどの程度の変異負荷を持つのか、また腫瘍抑制遺伝子Trp53の状態が変異頻度に影響するかを評価する。さらに、MYCのような比較的弱いドライバーが、腫瘍形成過程でどのような二次的な遺伝子変化を獲得するかを解明することも目的とする。
結果
GEMMはヒト腫瘍と比較して変異頻度が劇的に低い: 全エクソームシーケンス解析の結果、EGFRモデル(未治療腫瘍、n=10 mice)では中央値0.02非同義変異/Mb、KrasG12Dモデル(一次腫瘍、n=21 mice)では中央値0.07非同義変異/Mb(範囲0.00〜0.46)であった (Fig. 2A)。これは、TCGAのヒト肺腺癌データと比較すると、非喫煙者関連LUADの1.97変異/Mbと比べて約28倍低く (p < 0.0001)、喫煙者関連LUADの7.76変異/Mbとは約110倍の差があった (Fig. 2E)。ヒト肺腺癌全体の中央値6.86変異/Mbと比較しても、マウスモデルの変異頻度は50倍以上低く、最も変異頻度が高いマウスモデルでもこの格差は統計的に有意であった。
Trp53の状態は変異頻度に影響しない: KrasG12D;Trp53null腫瘍(n=13 mice、0.07変異/Mb)とKrasG12D;Trp53WT腫瘍(n=8 mice、0.06変異/Mb)の間には、Mann-Whitney U検定で統計的に有意な変異頻度の差は認められなかった (p = 0.60) (Fig. 2B)。異なるKrasモデル間でも変異頻度は類似しており、KrasLSL-G12D;Trp53fl/flモデル(n=9 mice、0.09変異/Mb)とKrasLA2-G12D;Trp53-/-モデル(n=4 mice、0.03変異/Mb)の間にも有意差はなかった (p = 0.1) (Fig. 2C)。この結果は、p53機能喪失がGEMMにおける変異負荷を有意に増加させないことを示唆している。
腫瘍由来細胞株は腫瘍本体より変異が多い: KrasLSL-G12D;Trp53fl/flモデル由来の細胞株(n=15 cell lines)の変異頻度(0.25変異/Mb)は、対応する原発腫瘍(n=9 tumors、0.07変異/Mb)と比較して有意に高かった (p = 0.001) (Fig. 2D)。このことは、細胞株化プロセスにおけるクローン選択または新規変異の蓄積を示唆している。また、腫瘍と細胞株間で変異の不完全な重複が認められ、腫瘍内にアレル頻度25%を超える変異が存在しても細胞株で検出されないケースがあり、腫瘍内クローン異質性の存在が示唆された。
既知がん遺伝子への変異集積はEGFR・Krasモデルでは希少: EGFRおよびKras駆動モデルでは、既知のドライバーがん遺伝子やがん抑制遺伝子への変異集積傾向はほとんど認められなかった。Krasモデルの腫瘍および細胞株で再発性変異が観察された遺伝子には、C5ar1、Dnahc5、Nyap2、Pcdh15、Pclo、Rngtt、Stil、Tenm4、Xirp2などがあったが、これらの大半は既知のがんドライバーではなく、乗客変異 (passenger mutation) であると推定された。EGFRモデルでは、Kras変異(n=4、G12VとQ61Rが各2例、一部は未治療腫瘍にも存在)およびUbe3b変異(n=2、同一マウスの2腫瘍)が再発性変異として同定された。
MYCモデルでは5例中3例でKrasG12体細胞変異を獲得: MYC過剰発現腫瘍(n=5 mice)の変異頻度は0.14変異/Mbであり、Krasモデルと比較して有意差はなかった (p = 0.57) (Fig. 2A)。特筆すべきことに、MYC駆動腫瘍5例中3例でKras G12変異(発がん性変異)、1例でFgfr2 K659M変異が同定され、これらはSangerシーケンスで独立して確認された。すなわち、5例中4例(80%)で既知のがんドライバー変異が検出された。Fgfr2 K659Mはチロシンキナーゼ活性を活性化し、MYCと腫瘍形成で協力することが報告されている。これはEGFRやKrasモデルでは二次ドライバー変異が観察されなかったことと対照的であり、MYCが比較的弱い腫瘍開始因子として、Ras経路活性化を「補う」ために二次変異を必要とすることを示唆した。
染色体全体のコピー数変化がモデル特異的パターンで出現: 焦点性 (focal) な増幅・欠失は主にアーチファクトと判断されたが、全染色体コピー数の変化が再発性に観察された (Fig. 4)。Krasモデルでは、Chr6の増幅が最も高頻度であり(≥20%の症例で増幅、KrasG12D変異アレル側の増幅)、その他にChr2、Chr15(Myc遺伝子座を含む)、Chr19の増幅と、Chr9、Chr14の欠失が≥20%の症例で観察された。EGFRモデルでは、Chr12の増幅が最も高頻度であり(TetO-EGFRトランスジーンの組み込み部位の可能性)、Krasモデルとは異なるコピー数プロファイルを示した。エルロチニブ耐性EGFRモデル(n=6 mice)では、耐性腫瘍と未治療腫瘍(n=10 mice)の変異頻度に差はなかった(0.02 vs 0.02変異/Mb、p = 0.49)が、全エクソームデータから1例でEGFR T790M変異が確認された。
変異シグネチャーの差異: EGFRモデルではC>T転換が優位な変異シグネチャーが観察され、これはヒトEGFR変異肺腺癌および非喫煙者腺癌のパターンと一致した。Krasモデルでは、EGFRモデルと有意に異なる変異シグネチャーが認められた (p = 0.0008)。
考察/結論
先行研究との違い: 本研究は、EGFR、Kras、MYCの3主要ドライバーによって誘導される遺伝子改変マウスモデル (GEMM) 肺腺癌が、ヒト腫瘍と比較して劇的に低い体細胞点変異負荷を示すことを、全エクソームシーケンスによって初めて系統的に実証した。これは、これまでの研究がDNAコピー数変化のスペクトラムに焦点を当ててきたことと異なり、体細胞点変異の包括的な解析が不足していたギャップを埋めるものである。特に、MYC駆動モデルがKrasやFgfr2の二次変異を高頻度で獲得するという所見は、強力なドライバーが存在するKras・EGFRモデルとは対照的であった。
新規性: 本研究で初めて、最適化されたマウスバリアントコーリングパイプラインを用いて、EGFR、Kras、MYC駆動GEMMの体細胞点変異景観を包括的に解析した。その結果、これらのGEMMがヒト肺腺癌と比較して極めて低い変異負荷を持つことを新規に明らかにした。また、MYC駆動腫瘍がKrasやFgfr2といった強力なドライバー変異を頻繁に獲得するという「補完的腫瘍進化」の原理を実験的に示したことは、腫瘍進化の法則に関する新たな知見である。
臨床応用: GEMMの遺伝的単純さは、付加的変異を導入する実験において「ノイズ」となる背景変異が少ないという利点を持つ。EGFR・Krasモデルでは背景変異が乏しいため、追加した変異の機能的影響を孤立した状態で評価でき、新規治療標的の同定や薬剤耐性機序の解明に臨床応用できる可能性がある。一方で、GEMMの低変異負荷はネオアンチゲン産生量が極めて少ないことを意味し、免疫チェックポイント阻害療法を研究する際には、GEMMのリンパ球浸潤が乏しいことと整合する。この知見は、免疫療法研究のためのGEMMの設計最適化に重要な臨床的含意を持つ。
残された課題: 今後の検討課題として、コピー数変化の機能的意義の検証(特にChr6増幅がKras活性をどの程度増強するか)、GEMMで同定された再発性コピー数変化のヒト腫瘍との体系的比較解析が残されている。また、腫瘍形成に要する細胞分裂数のin vivo定量は、マウスとヒトの変異頻度差のメカニズムを解明するために不可欠である。さらに、低変異背景GEMMを活用した腫瘍免疫学的研究の設計最適化(例:変異原物質、トランスポゾン、DNA修復欠損モデルの導入による変異負荷の増加)が今後の研究方向性として挙げられる。これらの取り組みにより、GEMMの臨床的関連性をさらに高めることができると考えられる。
方法
マウスモデルとサンプル収集: 本研究では、表1に示す5種類のGEMMから合計57サンプルを収集した。具体的には、(1) KrasLSL-G12D;Trp53fl/flマウス(lenti-Cre誘導)からは、腫瘍9例と細胞株15例(うち一部は対応する親腫瘍あり)を採取した。(2) KrasLA2-G12D;Trp53-/-マウス(自発的組換え)からは、腫瘍4例を収集した。(3) KrasLSL-G12D;Trp53WTマウス(lenti-Cre誘導)からは、腫瘍8例を収集した。(4) CCSP-rtTA;TetO-EGFRL858Rマウス(ドキシサイクリン誘導)からは、未治療腫瘍10例とエルロチニブ耐性腫瘍6例を収集した。(5) CCSP-rtTA;TetO-MYCマウス(ドキシサイクリン誘導)からは、腫瘍5例を収集した。すべての動物実験は、マサチューセッツ工科大学およびメモリアルスローンケタリングがんセンターの承認された動物実験委員会プロトコルに従って実施された。
全エクソームシーケンス (WES): 腫瘍組織および腫瘍細胞株から標準的な方法でDNAを精製した。2 μgのゲノムDNAをDiagenode Bioruptorを用いて超音波処理し、AMPureビーズを用いたデュアルセレクションによりサイズ選択を行った。エクソームキャプチャーはRoche SeqCap EZ all-exon mouseキットを用いて実施し、キャプチャー後のライブラリはIllumina HiSeqプラットフォームでシーケンスした。Krasモデルでは標準mm9ゲノムに、EGFRおよびMYCモデルではmm9+トランスジーン(hEGFRまたはhMYC)ハイブリッドゲノムにマッピングした。
バリアントコーリングパイプラインの最適化: マウスバックグラウンドにおける体細胞変異検出のため、既存のヒト用変異コーラー(muTect v1.1.4)と、GATK UnifiedGenotyperをベースに独自開発したHaJaVaコーラーを組み合わせたパイプラインを最適化した。C57BL/6と129S1/SvImJ近交系マウスの生殖細胞系DNAを混合して体細胞変異シミュレーションデータを作成し、両コーラーの精度を評価した。その結果、両コーラーの共通変異セットを用いることで、偽陽性を約50%削減しつつ偽陰性の増加を最小限に抑えられることを確認した。約50個の体細胞変異をPCRおよびSangerシーケンスで独立して検証した結果、95%を超える高い精度が示された。最終的な変異リストは、missense、nonsense、splice-site変異を含む「機能的」変異としてAnnovarでアノテーションされた。
染色体コピー数解析: WESデータから、腫瘍/正常ペアの被覆深度正規化ログ比を算出した。この解析では、bedtoolsを用いて各エクソンターゲット領域の被覆深度を計算し、ロバスト回帰法(Rのloess関数)を用いて、総深度と各ターゲット領域の局所GC含量の両方について正規化した。正規化された被覆深度から腫瘍/正常のログ比(log2)を算出し、これを円環2値分割法 (circular binary segmentation; Olshen et al. Biostatistics 2004) でセグメンテーションした。その後、RAEアルゴリズムを用いて増幅・欠失領域を定義した。このアルゴリズムは、各腫瘍/正常ペアのノイズに基づいてサンプル依存のソフト閾値を計算し、増幅と欠失の分画量を近似的に示す0-1の値を生成した。
変異スペクトラム・既知がん遺伝子解析: 同定された機能的変異を各モデル間で比較し、TCGAのヒト肺腺癌データ (Cancer et al. Nature 2014) と変異頻度・変異パターンを対比した。統計解析にはMann-Whitney U検定が用いられた。