• 著者: Hyo Sik Jang, Nakul M. Shah, Alan Y. Du, et al.
  • Corresponding author: Ting Wang (Washington University School of Medicine)
  • 雑誌: Nature Genetics
  • 発行年: 2019
  • Epub日: N/A
  • Article種別: Original Article
  • PMID: 30926969

背景

トランスポゾン (Transposable Elements, TEs) はヒトゲノムの約45%を占める反復配列であり、通常はDNAメチル化などのエピゲノム機構により転写が抑制されている。TEs自体は「ジャンク」と見なされることもあったが、進化の過程で宿主の調節配列として「exaptation (転用)」されることが知られていた (Xie et al. 2013, Sundaram et al. 2014, Rebollo et al. 2012)。一方、がんではゲノム全体のDNA低メチル化が広範に認められ、これによりTEsが再活性化してクリプティックプロモーター (隠蔽プロモーター) として機能する可能性がある (Hon et al. 2012, Baylin & Jones 2011, Esteller 2007)。この現象は「onco-exaptation」と命名されていたが (Babaian & Mager 2016)、単一のがん種・遺伝子での個別事例報告 (Lamprecht et al. 2010, Babaian et al. 2016, Lock et al. 2017) にとどまっており、多がん種を横断した体系的な頻度・分布の把握はなされていなかった。

TE由来のクリプティックプロモーターがどの程度がん遺伝子の高発現に寄与するか、DNAメチル化の変動と連動するか、また実際の腫瘍形成能への寄与があるかは未解明のままであった。特に、TEs由来のがん遺伝子発現がin vitroだけでなくin vivoでも腫瘍形成に不可欠かどうかの機能的証明は欠如しており、その全体像の理解には知識のギャップが残されていた。また、がんにおけるTEsの活性化が、単なる付随現象なのか、それともがん遺伝子活性化の主要なメカニズムとして機能するのかという点も不明であった。これらの背景から、onco-exaptationががん遺伝子活性化の広範かつ重要なメカニズムであるかどうかの包括的な検証が不足していた。

目的

本研究の目的は、15がん種にわたるTCGA RNA-seqデータを用いてTE onco-exaptationによるがん遺伝子発現の全体像を特徴づけることであった。具体的には、TE onco-exaptationイベントの頻度、分布、およびがん遺伝子発現への寄与を大規模な計算解析により明らかにすることを目指した。さらに、代表例としてAluJb-LIN28B融合転写物を選択し、その機能的意義を詳細に検証した。この検証には、(1) CRISPR-Cas9によるAluJbプロモーター欠失がLIN28B発現、細胞増殖、および腫瘍形成能に与える影響を評価し、その必要十分性を証明すること、(2) CRISPR-SunTagシステムを用いた標的DNAメチル化操作により、AluJbプロモーター活性のエピゲノム制御をin vitroで実証することが含まれた。これらの目的を達成することで、onco-exaptationががん遺伝子活性化における広範かつ重要なメカニズムであることを確立し、その分子基盤を解明することを目指した。

結果

TE onco-exaptationの広範な頻度と分布: 計算パイプラインの適用により、15がん種の腫瘍7,769検体にわたり106のがん遺伝子に129のTE由来クリプティックプロモーター活性化イベントが同定された。これらのイベントは3,864腫瘍に認められ、全解析腫瘍の49.7% (3,864/7,769腫瘍) に少なくとも1つのonco-exaptationイベントが存在した (Fig. 1a)。がん種別の有病率は12% (腎細胞癌) から87% (子宮内膜癌) と大きく異なり、特定がん種でのTE再活性化の選択的優位性が示唆された。平均で各onco-exaptationイベントは51検体で検出され、複数のがん種にわたって分布するものも多かった。TEクラスとしてLTR (long terminal repeat) が有意に濃縮されており、次いでSINE (Short Interspersed Nuclear Element)、LINE (Long Interspersed Nuclear Element) が多かった (Fig. 1b)。さらに8つのがん遺伝子では複数の異なるTEが同じがん遺伝子を同一のin-frameアイソフォームとして活性化するという「収束的exaptation」パターンも観察された (Supplementary Table 4)。

トップ10の高頻度イベントとがん遺伝子発現への高寄与: 最も頻度の高い10イベントはいずれも、対応するがん遺伝子の総発現量の平均50%以上をTE由来転写物が占めていた (Fig. 1d)。一部では90%超に達するものもあった。L1PA2-SYT1 (全腫瘍の約10%以上)、L1PA2-XCL1、MLT1J-SALL4、AluJb-LIN28Bなどが上位に挙げられた。8イベントはin-frameな転写物でタンパク質機能が保存されていると予測された。また、上位10イベントの半数が少なくとも1がん種で生存不良と関連した (Kaplan-Meier解析、Supplementary Fig. 4)。ルシフェラーゼアッセイとCAGE-seqで、H727肺カルチノイド細胞株においてSYT1とARID3Aのがん遺伝子がTE由来の代替プロモーターから転写されることが直接確認された (Fig. 2a)。

AluJb-LIN28Bの機能的重要性の証明: AluJbは正規LIN28Bプロモーターの約20 kb上流に位置し、H1299とH838両細胞株でCAGE-seqにより約40 bpにわたるCAGEピークが同定された (Fig. 2b)。H1299細胞ではAluJb周辺が脱メチル化・クロマチンアクセシブルであったのに対し、H838では約50%のメチル化、K562 (AluJb-LIN28Bを発現しない) ではAluJbが完全にメチル化されていた。CRISPR-Cas9によるAluJbプロモーター (AluJb-P) 欠失は、H1299およびH838細胞においてLIN28Bタンパク質の完全消失、let-7a/b/gの著明な上昇 (p < 0.05の一例、Fig. 3c)、増殖速度の有意な低下 (Fig. 3d)、遊走能の有意な低下 (Fig. 3e) をもたらした。具体的には、H1299細胞におけるAluJb-P欠失クローンは、野生型と比較してlet-7a、let-7b、let-7g miRNAレベルが有意に増加し (n=4 independent experiments, p<0.001 for let-7a, p=0.003 for let-7b, p=0.002 for let-7g)、細胞増殖と移動が著しく遅延した (n=3 independent experiments, p<0.001)。H1299 AluJb-P欠失クローンはヌードマウス皮下移植での腫瘍形成能が著明に低下した (Fig. 3f)。この実験では、野生型マウス (n=4 mice) とAluJb-Pノックアウトマウス (n=6 mice) を比較し、腫瘍増殖に顕著な欠陥が認められた。LIN28BP欠失ではこれらの変化は観察されず、LIN28B機能維持にAluJb-Pが必須であることが証明された。FLAG-LIN28BまたはAluJb-LIN28Bの再発現により、let-7の低下と増殖の部分回復が確認された (Fig. 3g)。AluJb-LIN28Bタンパク質はN末端に22アミノ酸が付加される構造で、分子量が正規LIN28Bより約2.5 kDa大きいことをウエスタンブロットで確認した (Supplementary Fig. 6d)。

DNAメチル化によるAluJbプロモーターの動的制御: CRISPR-SunTag-DNMT3Aを用いてH1299のAluJb領域のメチル化を約20〜30%増加させると (Fig. 4c)、LIN28B発現が約40%低下した (Fig. 4d, p<0.001)。逆にCRISPR-SunTag-TET1CDを用いてK562のAluJbを脱メチル化すると、AluJb-LIN28B融合タンパク質 (H1299/H838と同サイズ) が新たに発現した (Fig. 4f)。これはDNAメチル化の変動がAluJb-PのON/OFFスイッチとして機能することを標的エピゲノム編集で直接証明した初の結果である。FIMO解析でAluJb-P配列内にSP1、SP4、YY1、NFYA、C/EBPDの転写因子結合サイト候補が同定され、ルシフェラーゼアッセイでSP1、SP4、YY1サイトの変異がAluJb-Pの転写活性を有意に低下させた (Fig. 2d, p<0.001)。

考察/結論

新規性: 本研究は、TE onco-exaptationが特定のがん種・遺伝子に限られた稀なイベントではなく、15がん種の約半数 (49.7%) の腫瘍に認められる普遍的ながん遺伝子活性化メカニズムであることを初めて体系的に示した。腫瘍における大規模な計算解析と代表例AluJb-LIN28Bの精緻な機能的・エピゲノム的検証を統合した点が本研究の独創性である。特に、CRISPR-SunTagという精緻な標的エピゲノム編集技術を用いて、DNAメチル化の変動がTEのクリプティックプロモーター活性化の分子基盤であることを直接証明した点は、これまで報告されていない新規な知見である。

先行研究との違い: 先行研究では個別のonco-exaptationイベントの記述 (Lamprecht et al. 2010, Babaian et al. 2016, Lock et al. 2017) が散発的に報告されていたが、本研究はこれまでの研究と異なり、がんゲノム全体にわたる網羅的なパノラマを初めて示した。また、AluJb-LIN28Bの腫瘍特異的代替プロモーター利用はGuo et al. (2018)によって肝臓がんでも報告されているが、本研究は肺がん細胞株における同様の知見を提供し、onco-exaptationの文脈でその堅牢な発がん性ポテンシャルを裏付けた。

臨床応用: 本知見はがん治療の臨床応用に複数の重要な含意を持つ。第一に、onco-exaptationイベントはDNAメチル化変動により制御されるため、エピゲノム療法 (例:5-アザシチジンなどDNA脱メチル化剤) がTE由来のがん遺伝子活性化を促進するリスクが存在し、治療設計において考慮が必要である。特に5-アザシチジン投与後にゲノム全体の低メチル化が生じ、onco-exaptationが誘導されるという副作用リスクは治療計画上の重要な課題である。第二に、TEのクリプティックプロモーターはがん細胞特異的に活性化されるため、正常組織では発現しない腫瘍特異的ネオアンチゲンとなり、免疫療法の標的や診断バイオマーカーとして活用できる可能性がある。第三に、LIN28B-let-7軸は複数のがん種でOncogenic機能が確立されており、AluJb-LIN28Bの腫瘍選択的発現はLIN28B阻害薬の治療ウィンドウ拡大につながりうる。

残された課題: 今後の検討課題として、129イベントの個別機能的重要性の検証 (AluJb-LIN28B以外のイベントでの細胞実験)、TEメチル化変動とがん遺伝子活性化の時系列因果関係の解析 (腫瘍発生初期からのTE再活性化の解明)、翻訳産物の機能的特異性と免疫原性の評価が必要である。また、本研究はin vitroおよびin vivoモデルでAluJb-LIN28Bの機能的役割を詳細に検証したが、他のonco-exaptationイベントについても同様の機能的検証を行うことが残された課題である。

方法

計算パイプラインによるTE onco-exaptationイベントの同定: TCGA 15がん種の腫瘍7,769検体と正常対照625検体 (GTEx) のRNA-seqデータを解析した。GENCODE v.25参照とStringtie v.1.3.3を用いて転写物をアセンブルし、TE起源のがん遺伝子融合転写物 (cryptic TSS from TE + splice into oncogene) を同定した。702のがん遺伝子リスト (ONGeneおよび公知のonco-exaptation例) を用い、以下の厳格なフィルタリング基準を適用した。すなわち、腫瘍で10倍以上の高発現、少なくとも4腫瘍検体での検出、スプライスジャンクションリードの存在、平均エクソン長がGENCODE v.25トランスクリプトの99パーセンタイル以下、イントロンを保持する第一エクソンの除外、少なくとも2サンプルでの存在、TE内で開始するユニークリードが10以上、TEとスプライスターゲットにマッピングするペアエンドリードの存在、エクソナイゼーションの証拠が15%未満、シングルエンドRNA-seqファイルのみの候補の除外である。がん遺伝子の総発現量への寄与割合 (Fraction Expression) も算出した。転写開始部位はFANTOM5プロモーターデータベースとCAGE-seqで検証した。

AluJb-LIN28Bの機能的検証: 肺癌細胞株H1299とH838を用いて、CAGE-seq、WGBS-seq、ATAC-seqを実施し、AluJbのエピゲノム状態を確認した。CRISPR-Cas9システムを用いて、AluJbプロモーター (AluJb-P) と正規LIN28Bプロモーター (LIN28BP) をそれぞれ欠失させた。これらの欠失がLIN28Bタンパク質発現、let-7 miRNAレベル、細胞増殖 (CCK-8アッセイ)、遊走 (スクラッチアッセイ)、およびin vivo腫瘍形成 (ヌードマウス皮下移植、n=4 for WT, n=6 for KO) に与える影響を評価した。統計解析には二側性Welchのt検定を用いた。また、CRISPR-SunTagシステム (dCas9-DNMT3A / dCas9-TET1CD) を用い、AluJb領域の標的メチル化・脱メチル化を行い、LIN28B発現変動を検証した。ルシフェラーゼアッセイにより、AluJbプロモーター内の転写因子結合サイト (SP1, SP4, YY1, NFYA, C/EBPD) の機能的重要性も評価した。