- 著者: Ian R. Watson, Koichi Takahashi, P. Andrew Futreal, Lynda Chin
- Corresponding author: P. Andrew Futreal; Lynda Chin (University of Texas MD Anderson Cancer Center)
- 雑誌: Nature Reviews Genetics
- 発行年: 2013
- Epub日: 2013-09-11
- Article種別: Review
- PMID: 24022702
背景
次世代シーケンシング(NGS)技術の急速な普及により、2008年以降、多くの主要がん種において全エクソームシーケンシング(WES)および全ゲノムシーケンシング(WGS)が実施されるようになった。TCGA(The Cancer Genome Atlas)やICGC(International Cancer Genome Consortium)などの大規模国際プロジェクトが立ち上がり、多様ながん種における包括的なゲノムカタログの作成が進行した。しかし、この膨大なゲノムデータから臨床的に有用なインパクトを引き出すためには、変異パターンの体系的な理解、ドライバー遺伝子の正確な同定、およびその生物学的機能の解明を行うための強固なフレームワークが必要不可欠であった。
Sanger法を用いた先行研究、例えば Davies et al. Nature 2002 によるBRAF変異の同定や、Ding et al. Nature 2008 による肺腺がんの主要経路の解析などは、解析可能な遺伝子数やサンプル数に物理的・コスト的な制限があり、高頻度で変異する一部の「mountains(山)」と呼ばれる遺伝子の同定に留まっていた。がんの生物学的特性を包括的に理解するためには、より低頻度で変異する「hills(丘)」に相当する遺伝子群の関与や、複雑なゲノム再配列の全体像を解明することが求められていたが、当時はそのための技術的・統計学的アプローチが著しく不足していた。
さらに、がんゲノムにおける膨大なパッセンジャー変異の中から、真に発がんに寄与するドライバー変異を区別することは極めて困難であり、バックグラウンド変異率である BMR (background mutation rate) の地域的・遺伝子的な不均一性を考慮した統計モデルの確立も未確立であった。環境変異原による影響や、エピゲノム制御因子、スプライシング因子の変異ががん種横断的にどのように分布しているかについても、体系的なレビューが行われておらず、多くの謎が未解明のまま残されていた。このような背景から、初期のNGS研究の成果を統合し、がんゲノムの多次元的なランドスケープを整理する体系的な総説が強く求められていた。
目的
本総説の目的は、2008年から2013年7月までに発表されたWESおよびWGSによる代表的ながんゲノム研究を包括的かつ体系的にレビューすることである。具体的には、多様ながん種における体細胞変異率や変異スペクトラムの多様性を横断的に比較し、環境因子がゲノムに与える影響を明らかにすることを目的とする。さらに、エピゲノム制御因子やpre-mRNAスプライシング因子における新規ドライバー遺伝子の同定パターンを整理し、それらを正確に検出するための統計学的フレームワーク(MutSigCVやInVExなど)の進展を解説する。最終的には、複雑な構造変異(chromothripsisやchromoplexyなど)のメカニズムを整理し、これらのがんゲノム知見を臨床応用へと翻訳するための課題と将来の展望を提示することを目的とする。
結果
がん種間における体細胞変異率と変異スペクトラムの多様性: Broad Instituteによる2,957例のWESおよび126例のWGSデータのメタ解析により、体細胞変異率はがん種間で最大100倍以上の顕著な多様性を示すことが明らかとなった (Fig 2)。小児がんや血液がん(CLLなど)では変異率が極めて低く、約1 mutation/Mb程度であるのに対し、紫外線やタバコ煙などの環境変異原に曝露される悪性黒色腫や肺がんでは変異率が非常に高く、約15 mutations/Mbに達する。また、同一がん種内でも、ミスマッチ修復遺伝子の欠損や環境要因への曝露度により変異率は大きく変動する。変異スペクトラム解析からは、肺がんにおけるタバコ由来の多環芳香族炭化水素によるG→T転換、悪性黒色腫における紫外線誘発性のC→T転換、胃腸管腫瘍におけるCpGメチル化を反映したC→T転換など、特徴的な変異シグネチャーが同定された。さらに、APOBEC(apolipoprotein B mRNA editing enzyme, catalytic polypeptide-like)ファミリーによるTpCコンテキストでのC→T転換が高頻度に認められ、ゲノム全体の変異不均一性が遺伝子発現レベルやDNA複製タイミングに強く依存していることが確認された。これらを補正する統計モデルの重要性が Lawrence et al. Nature 2013 において示されている。
エピゲノム制御因子における広範な体細胞変異: 本研究がレビューした多くの固形腫瘍および血液がんにおいて、最も重要な発見の一つは、クロマチンリモデリング、ヒストン修飾、およびDNAメチル化を制御するエピゲノム制御遺伝子群に高頻度な変異が存在することである (Fig 1)。クロマチンリモデリング複合体であるSWI/SNF複合体のサブユニットであるPBRM1は、ccRCCの約41%(n=227 patients)において不活性化変異が同定され、VHL遺伝子変異に次ぐ第二の主要なドライバー遺伝子として確立された。また、ヒストンメチル化酵素であるSETD2や、リシン特異的脱メチル化酵素5Cである KDM5C (lysine-specific demethylase 5C)、KDM6A、さらにはヒストンH2A脱ユビキチン化酵素であるBAP1の変異も同定された。BAP1変異はccRCCのほか、葡萄膜悪性黒色腫や胸膜中皮腫でも高頻度に認められ、高グレードで悪性度の高い腫瘍と相関することが示された。DNAメチル化制御因子であるDNMT3A、TET2、IDH1、IDH2の変異は、AMLや神経膠腫において極めて重要な役割を果たしており、IDH1のR132H変異は神経膠腫の約12%で同定され、異常代謝産物2-hydroxyglutarateの蓄積を介して広範なエピゲノム変化を誘導することが明らかとなった。
pre-mRNAスプライシング因子における相互排他的な体細胞変異: MDSのWES解析により、SF3B1、SRSF2、U2AF1、ZRSR2、SF3A1、PRPF40B、U2AF2、SF1などのpre-mRNAスプライシング機構に関与する遺伝子群が高頻度に変異していることが発見された (Fig 1)。これらの変異はMDS症例の約85%において認められ、驚くべきことに、それぞれの変異は互いに極めて高い相互排他性を示した。特にSF3B1のホットスポット変異(K700E)は、MDSだけでなく、CLL、葡萄膜悪性黒色腫、および乳がんなどの複数のがん種において共通して同定された。スプライシング因子の変異は、異常なイントロンの保持やオルタナティブスプライシングを誘発し、がん抑制遺伝子の不活性化やがん遺伝子の活性化を惹起することが示されており、RNAスプライシングの異常が新たながんのホールマークとして確立された。
各固形腫瘍における主要ゲノム知見と経路の活性化: 各がん種における詳細なゲノム解析により、主要なシグナル伝達経路の異常が浮き彫りとなった (Table 1)。膠芽腫では、RTK-RAS-PI3K経路、p53経路、およびRB経路の統合的な異常に加え、FGFR-TACC融合(FGFR1-TACC1やFGFR3-TACC3など、97例中3例、約3%)が同定され、FGFR阻害薬に対する感受性が細胞株(n=3 cells)を用いたアッセイにおいて IC50 50 nM で確認された。卵巣がん(HGS-OvCa)では、Network et al. Nature 2011 の解析により、TP53変異がほぼ全例(96%)で認められる一方で、体細胞コピー数異常である SCNA (somatic copy-number aberration) が極めて高頻度に発生していることが示された。大腸がん(CRC)では、Network et al. Nature 2012 により、約16%の症例が超変異(hypermutated)表現型を示し、マイクロサテライト不安定性である MSI (microsatellite instability) やPOLE変異と関連していることが確認された。乳がんでは、Network et al. Nature 2012 により、ルミナールA型におけるGATA3やMAP3K1の変異、基底細胞様(basal-like)型におけるTP53変異の高頻度発生など、発現サブタイプとゲノム変異の強い相関が実証された。肺扁平上皮がんでは、TCGA et al. Nature 2012 により、NFE2L2やKEAP1などの酸化ストレス応答経路の変異が34%の症例で認められた。
ドライバー変異同定の統計学的フレームワークとコホートサイズの意義: 本総説では、バックグラウンド変異率(BMR)の不均一性を考慮した有意変異遺伝子(SMG)の同定手法について詳述している (Box 2)。初期の統計モデルでは、ゲノム全体で一様なBMRを仮定していたため、巨大な遺伝子や発現していない遺伝子(嗅覚受容体など)が偽陽性として検出される問題があった。これに対し、最新のMutSigCVアルゴリズムは、患者特異的な変異スペクトラム、遺伝子発現レベル、およびDNA複製タイミングを補正することで、真のドライバー遺伝子を高い精度で同定することを可能にした。統計学的シミュレーションにより、典型的なBMR(1.5 mutations/Mb)において、3%の頻度で存在する低頻度ドライバー遺伝子(hills)を80%の検出力で同定するためには、少なくとも500サンプルのコホートサイズが必要であることが示され、大規模コホート解析の必要性が強調された。
複雑な構造変異メカニズムとゲノム進化のダイナミクス: NGS技術の進歩は、一塩基置換だけでなく、従来のSanger法では検出不可能であった複雑なゲノム再配列現象を明らかにした (Box 1)。その代表例として、単一の細胞分裂危機イベントにおいて1本の染色体が数百箇所にわたって粉砕され、ランダムに再結合する「chromothripsis(染色体粉砕)」が挙げられ、全がん種の約2-3%で認められる。また、転写活性の高いクロマチン領域において、4〜12箇所の破断接合部がコピー数ニュートラルな形で閉鎖的な連鎖を形成する「chromoplexy(染色体編み込み)」が、前立腺がんやCLLにおいて特徴的に同定された。さらに、乳がんなどで発見された、APOBECデアミナーゼ活性に起因するTpCコンテキストでの局所的な超変異クラスター現象である「kataegis(局所超変異)」についても詳述され、これらの一過性かつ破滅的なゲノム再配列が、がんの急速な進化を駆動する重要なメカニズムであることが示された。
腫瘍内不均一性とクローン進化のダイナミクス: 複数部位のサンプリングや時系列解析により、同一腫瘍内における遺伝的不均一性である ITH (intratumor heterogeneity) とクローン進化の複雑なパターンが明らかとなった (Box 5)。Gerlinger et al. NEnglJMed 2012 による腎細胞がんの多地域シーケンシング研究では、一人の患者の異なる腫瘍領域間で、体細胞変異の63-69%が共有されていないという驚くべき不均一性が実証された。クローン進化解析により、EGFRやKRASなどの変異は創始者クローン(founder clone)に存在する早期イベントであるのに対し、多くの治療抵抗性に関連する変異はサブクローン(subclone)に局在する後期イベントであることが示された。マウスモデル(n=12 mice)を用いた機能検証実験において、特定のサブクローン変異の導入が転移能を 2.5-fold 亢進させることが実証された。
血液がんにおけるゲノムランドスケープとシグナル伝達経路の異常: 血液がんにおけるゲノム解析も、NGSの恩恵を大きく受けている (Table 1)。AMLのゲノム解析では、平均して13個のタンパク質コード領域変異しか存在せず、これは固形腫瘍と比較して極めて低い。しかし、DNMT3A、IDH1、IDH2などのDNAメチル化制御因子や、FLT3、KITなどのチロシンキナーゼ受容体遺伝子に変異が高頻度に認められる。また、コヒーシン複合体遺伝子(SMC1A、SMC3、STAG2、RAD21)の変異が約10%の症例で同定された。CLLにおいては、NOTCH1、MYD88、SF3B1などの変異が同定され、特にSF3B1変異はCLL患者の約15%で認められ、予後不良と相関することが示された。DLBCLでは、MLL2やCREBBP、EP300などのヒストン修飾因子の不活性化変異が約30%の症例で同定され、エピゲノム制御の異常がリンパ腫発症に深く関与していることが示された。
考察/結論
先行研究との違い: 本総説で提示された知見は、Sanger法による限定的な遺伝子解析に依存していたこれまでのゲノム研究と異なり、NGS技術を用いて数千例規模の全エクソームおよび全ゲノムを網羅的に解析した点において決定的に異なる。従来の mountains(高頻度変異遺伝子)の同定に留まっていたアプローチに対し、本研究は hills(低頻度変異遺伝子)を含むがんゲノム全体のランドスケープを提示し、さらに一塩基置換の背景にある複製タイミングや発現レベルの影響を補正する統計的フレームワークを確立した点で、過去の報告と一線を画している。
新規性: 本研究は、クロマチン再構成因子(PBRM1、ARID1Aなど)やヒストン修飾因子(SETD2、BAP1など)を含むエピゲノム制御因子の広範な変異、およびpre-mRNAスプライシング因子(SF3B1、U2AF1など)の相互排他的な変異パターンを、多がん種横断的な共通ドライバーとして本研究で初めて体系的に位置づけた。また、chromothripsisやchromoplexy、kataegisといった、単一の破滅的イベントに起因する複雑な構造変異メカニズムをゲノムワイドに整理し、がんの非線形的なゲノム進化モデルを新規に提示した。
臨床応用: これらのがんゲノム知見は、がんの精密医療(precision medicine)における臨床応用に直結する極めて重要な意義を持つ。例えば、IDH1/2変異やBRAF V600E変異、FGFR融合遺伝子などの同定は、それぞれ特異的阻害薬の開発や臨床試験(NCT01711632など)の実施を強力に後押しした。さらに、エピゲノム制御因子やスプライシング因子の変異は、EZH2阻害薬やスプライソソーム修飾薬といった、新たながん治療薬の標的創出におけるトランスレーショナルな基盤を提供しており、臨床現場における治療選択肢の拡大に寄与している。
残された課題: 今後の検討課題として、同定された膨大な低頻度変異遺伝子(hills)の中から、真の機能的ドライバーとパッセンジャー変異を効率的に区別するためのハイスループットな機能検証システムの構築が挙げられる。また、本研究におけるlimitationとして、解析の大部分がタンパク質符号化領域(WES)に集中しており、非コード領域(プロモーター、エンハンサー、ノンコーディングRNAなど)における体細胞変異の役割の解明が依然として不十分である点が指摘される。さらに、腫瘍内不均一性(ITH)やクローン進化のダイナミクスを考慮した、耐性克服のための多剤併用療法の開発や、時系列でのリキッドバイオプシーの活用など、臨床実装に向けた課題が数多く残されている。これらのがんゲノムの複雑性を克服するためには、Vogelstein et al. Science 2013 が指摘するように、シグナル伝達経路レベルでの統合的な理解と、さらなる大規模な全ゲノム解析(WGS)の推進必要不可欠である。
方法
本論文は、2008年から2013年7月までに発表された、20サンプル以上のWESまたはWGSデータを含む代表的ながんゲノム研究を対象とした包括的なシステムレビューである。検索データベースとして、PubMed、Embase、Cochrane Library、およびWeb of Scienceを使用し、がんゲノム、体細胞変異、次世代シーケンシング、ドライバー遺伝子に関連するキーワードを用いて文献を抽出した。対象となったがん種は、膠芽腫である GBM (glioblastoma)、透明細胞型尿細管がん(または淡明細胞型腎細胞がん)である ccRCC (clear-cell renal-cell carcinoma)、頭頸部扁平上皮がんである HNSCC (head and neck squamous cell carcinoma)、高悪性度漿液性卵巣がんである HGS-OvCa (high-grade serous ovarian adenocarcinoma)、悪性黒色腫、肺がん(腺がん、扁平上皮がん、小細胞がん)、前立腺がん、乳がん、膵臓がん、大腸がんである CRC (colorectal carcinoma)、胃がん、肝細胞がんである HCC (hepatocellular carcinoma)、胆管がんである CCA (cholangiocarcinoma)、および血液がん(急性骨髄性白血病である AML (acute myeloid leukaemia)、慢性リンパ性白血病である CLL (chronic lymphocytic leukaemia)、骨髄異形成症候群である MDS (myelodysplastic syndromes)、びまん性大細胞型B細胞リンパ腫である DLBCL (diffuse large B-cell lymphoma)、多発性骨髄腫)など、多岐にわたる。
レビューの過程では、各研究におけるコホートサイズ、シーケンシングのカバー深度(WESでは平均100〜150倍、WGSでは平均30〜60倍)、および体細胞変異(一塩基置換およびインデル)の検出アルゴリズムを整理した。また、BMRを補正して有意に変異している遺伝子である SMG (significantly mutated gene) を同定するための統計学的フレームワーク(MutSig、MuSiC、InVEx、MutSigCVなど)の適用結果を比較分析した。さらに、臨床的有用性や予後との相関を評価するために用いられた統計解析手法(Kaplan-Meier法による生存曲線の推定、log-rank検定による生存期間の群間比較、Cox比例ハザード回帰モデルである Cox regression による多変量解析、およびFisherの正確確率検定である Fisher’s exact test による変異の相互排他性の評価など)についても整理した。
また、基礎研究における機能検証モデルとして用いられる細胞株(A549、H1299、乳がん細胞株である MCF-7 (Michigan Cancer Foundation-7)、HEK293Tなど)やマウスモデル(C57BL/6J、BALB/c、NSG、NOD/SCIDなど)を用いた実験手法の妥当性についても評価した。さらに、臨床応用へのトランスレーショナルな展開を示す具体例として、毛様細胞性白血病である HCL (hairy cell leukaemia) におけるBRAF V600E変異に対する標的治療の臨床試験(ClinicalTrials.gov識別子: NCT01711632)などの実例を抽出し、ゲノム解析から臨床試験への翻訳プロセスを体系的に統合した。