- 著者: The Cancer Genome Atlas Network
- Corresponding author: Richard Kucherlapati (Department of Genetics, Harvard Medical School / Division of Genetics, Brigham and Women’s Hospital, Boston, MA, USA)
- 雑誌: Nature
- 発行年: 2012
- Epub日: 2012-07-18
- Article種別: Original Article
- PMID: 22810696
背景
大腸癌 (colorectal cancer, CRC) は世界的に発症率・死亡率ともに高い癌腫であり、その分子病態の包括的理解が治療標的同定の鍵となる。CRCはこれまで生物学的に大きく二分類されてきた。主に右側結腸に発生しCpG island methylator phenotype (CIMP; CpGアイランドメチル化表現型) と関連するmicrosatellite instability (MSI; マイクロサテライト不安定性) 陽性の高変異型と、microsatellite stable (MSS; マイクロサテライト安定) でchromosomal instability (CIN; 染色体不安定性) を示す非高変異型の2群である (Fearon, Annu. Rev. Pathol. 2011)。
先行する大規模ゲノム研究として、Sjoblom et al. (Science 2006) やWood et al. (Science 2007) による配列解析で多数の反復変異遺伝子が同定されてきた。WNT、RAS-MAPK、PI3K、TGF-β、p53、DNA mismatch repair (MMR; ミスマッチ修復) 各経路に関わる個別遺伝子異常の寄与も明らかにされ、VTI1A (vesicle transport through interaction with t-SNAREs 1A)-TCF7L2染色体転座などの再発性構造異常も報告された。TCGAプロジェクトはそれ以前に膠芽腫 (Network et al. Nature 2008) および卵巣癌 (Network et al. Nature 2011) において多次元統合解析の有効性を示しており、同手法のCRCへの適用が期待されていた。
しかしながら、これらの先行研究にもかかわらず、CRCの遺伝的・エピゲノム的異常を多次元的に統合した包括的なランドスケープは未解明のまま残されており、高変異型と非高変異型それぞれにおける変異スペクトルの全容・新規治療標的の体系的同定・結腸癌と直腸癌のゲノム的異同という重要な問いに対する答えは不足していた。特に、WNT経路の全体的な関与や新規ドライバー遺伝子の情報は手薄であり、ERBB2増幅・IGF2 (insulin-like growth factor 2) 過剰発現を含む治療応用可能な分子標的の体系的調査が不足していた。
目的
TCGAプロジェクトの一環として、結腸癌および直腸癌の検体に対して多次元ゲノムプロファイリングを実施し、CRCの包括的分子プロファイルを確立すること。具体的には、(1) hypermutatedとnon-hypermutated腫瘍における変異スペクトルの同定と比較、(2) WNT・RAS-MAPK・PI3K・TGF-β・p53の主要シグナル経路における体系的異常の把握、(3) 結腸癌と直腸癌のゲノムレベルでの比較、(4) ERBB2増幅やIGF2過剰発現を含む治療標的候補の同定を目的とした。
結果
高変異型と非高変異型の二峰性変異パターン: 224例のCRC検体のexome sequencing解析から、変異率が明確な二峰性分布を示すことが示された (Fig. 1a)。全体の84%にあたるnon-hypermutated群は非サイレント変異中央値n=58個を有し、変異率は8.24 mutations/Mb未満であった。一方、16%のhypermutated群は変異率12 mutations/Mbを超え、総変異数中央値はn=728個に達した。高頻度MSI (MSI-H) はhypermutated腫瘍の77% (23/30例) で確認され、このうち19例でMLH1プロモーターメチル化が認められ、さらに17例がCIMP-highを示した。MLH1サイレンシングを有するhypermutated腫瘍では、コーディング配列内の長いモノヌクレオチドリピートにおけるフレームシフト変異率がMLH1非サイレンシングhypermutated腫瘍の3.6-foldに達し、non-hypermutated腫瘍との比較では50-foldに達した。最高変異率を示す6例を含む残る7例のhypermutated腫瘍はMSI-H・CIMP・MLH1メチル化を欠き、POLE (DNA polymerase epsilon) エクソヌクレアーゼドメイン変異またはMMR遺伝子体細胞変異を有するultramutated表現型を形成した。これらの知見はhypermutated腫瘍内においてもMLH1サイレンシング依存型とPOLE/MMR変異依存型の異なる発症機序が存在することを示しており、非高変異型とは根本的に異なる腫瘍形成経路が存在することを裏付ける。
非高変異型における有意変異遺伝子と新規ドライバーの同定: MutSigアルゴリズムと手動キュレーションを統合した解析により、hypermutatedおよびnon-hypermutated腫瘍を合わせて合計32の体細胞反復変異遺伝子が同定された (Fig. 1b)。non-hypermutated腫瘍における最頻変異遺伝子はAPC (81%)、TP53 (60%)、KRAS (43%)、PIK3CA (18%)、FBXW7、SMAD4、TCF7L2、NRASの8遺伝子であった。新規のドライバー遺伝子として、SOX9 (SRY-box transcription factor 9) がCRCにおいて高頻度に変異していることが本研究で初めて同定された。non-hypermutated腫瘍における9つのSOX9変異アレルはすべてフレームシフトまたはナンセンス変異であり、機能喪失型であることが示された。SOX9は腸幹細胞ニッチでの細胞分化に関与しWNTシグナルによって転写抑制を受けることが知られており、その機能喪失がβ-カテニン分解促進を阻害しWNT経路の過剰活性化に寄与する可能性がある。FAM123B (family with sequence similarity 123B、別名WTX; Wilms tumor suppressor gene on the X chromosome) もX連鎖性WNT抑制因子として同定され、ほぼすべてが機能喪失型変異であった。ARID1A (AT-rich interactive domain 1A) とATMについても高頻度のフレームシフト/ナンセンス変異が確認された。hypermutated腫瘍ではTP53変異がnon-hypermutated群と比較して有意に低頻度であり (20% vs 60%, p<0.0001、Fisher’s exact test)、APC変異も低頻度であった (51% vs 81%, p=0.0023)。ACVR2A (activin A receptor type 2A)、TGFBR2、MSH3、MSH6、SLC9A9 (solute carrier family 9 member A9)、TCF7L2の変異はhypermutated腫瘍に特徴的であり、BRAF V600E変異も大部分を占めた。これらの差異は両群が異なる遺伝的進化経路を経ることを明確に示している。
結腸癌と直腸癌のゲノム的等価性とDNAメチル化サブタイプ: 132例の結腸癌と62例の直腸癌を含む非高変異型腫瘍194例について、コピー数異常パターン、CIMPステータス、mRNA発現プロファイル、miRNA発現プロファイルの統合解析を実施した結果、解剖学的起源にかかわらずゲノムレベルでの有意な差異は認められなかった (Fig. 2)。この結果に基づき以降の解析では結腸癌と直腸癌を統合して扱った。なお右側結腸の腫瘍はhypermethylationが他部位より高頻度であり、hypermutated腫瘍の約3/4が右側結腸に由来していた。236例のDNAメチル化プロファイルの非教師あり階層クラスタリングによりCIMP-high、CIMP-low、および2つの非CIMPクラスターの4サブグループが同定された。mRNA発現解析では3つのクラスターが形成され、そのうち1つがCIMP-high腫瘍と有意に重複しhypermutated腫瘍が濃縮されていた。miRNA解析では直腸癌と非高メチル化結腸癌の間に明確な差は認められなかった。
コピー数異常・染色体再編成・新規融合遺伝子: 257例のAffymetrix SNP 6.0アレイを用いたSCNA解析とGISTICアルゴリズムにより、有意な欠失染色体腕として18p/q (SMAD4を含む、66%)、17p/q (TP53を含む、56%) が同定された。加えて1p、4q、5q、8p、14q、15q、20p、22qなどの欠失腕も確認された。焦点増幅領域は17領域が同定され、17q21.1 (ERBB2を含む、4%)、8q24 (MYC)、11p15.5 (IGF2・miR-483、7%)、20q13.12 (HNF4A近傍)、13q12 (CDK8近傍) が含まれた (Fig. 3a)。低深度WGS (n=97例) によって候補染色体間転座が合計250件検出された。既報のVTI1A (vesicle transport through interaction with t-SNAREs 1A)-TCF7L2融合遺伝子 (CRCの3%で確認) に加えてNAV2-TCF7L1融合遺伝子が3症例で新たに同定された。この融合タンパク質はTCF3のβ-カテニン結合ドメインを欠損すると予測され、WNTシグナル転写制御に影響を与える可能性がある。TTC28関連転座は21症例で確認されTCC28の不活化をもたらすと予測された。11p15.5の焦点増幅 (7%の腫瘍) においてIGF2 (insulin-like growth factor 2) とmiR-483が選択的に過剰発現を示したが (Fig. 3b)、増幅を欠く15%の症例でもIGF2 mRNAが最大100-fold過剰発現しており、インプリンティングの喪失が主因と考えられた。IGF2過剰発現とPI3K経路活性化イベント (PIK3CA・PIK3R1変異、PTEN欠失) の間には有意な相互排他性が確認された (p<0.01、MEMo法; Fig. 3c)。
主要シグナル経路の体系的異常と治療標的候補: 195例を対象とした変異・コピー数・mRNA発現の統合解析により、主要シグナル経路における体系的異常の全体像が明らかにされた (Fig. 4)。WNTシグナル経路の異常は93%の全腫瘍で確認され、APCのbiallelic不活化またはCTNNB1の活性化変異が約80%の症例に認められた。SOX9、TCF7L2欠失/変異、FAM123B、ARID1A、DKK、AXIN2、FBXW7など計16種の異なるWNT経路遺伝子の異常が同定され、APC変異を有する腫瘍においても多重なWNT経路病変が蓄積していた。FZD10 (frizzled class receptor 10、WNTリガンド受容体) は約17%の腫瘍で最大100倍の過剰発現を示した。RAS-MAPK経路の異常はnon-hypermutated腫瘍の55%で確認され、KRAS・NRAS・BRAF V600Eの変異は強い相互排他性を示した。PI3K経路ではPIK3R1 (2%)、PIK3CA (15%)、PTEN欠失 (4%) の異常が同定され、RAS経路とPI3K経路の共異常が全腫瘍の約1/3で認められた (p=0.039、Fisher’s exact test)。TGF-β経路はnon-hypermutated腫瘍の27%・hypermutated腫瘍の87%で異常を認め (TGFBR1、TGFBR2、ACVR2A、ACVR1B、SMAD2、SMAD3、SMAD4)、p53経路はnon-hypermutated腫瘍の59%でTP53変異 (大半がbiallelic) を示しATM異常が7%に認められ両者に相互排他的傾向が示された (p=0.016)。ERBBファミリーの変異または増幅はnon-hypermutated腫瘍の13% (22/165例)、hypermutated腫瘍の53% (16/30例) で確認された。特にERBB2 V842I変異が4例に、ERBB3 V104M変異が2例に再発性に検出された。PARADIGM統合解析では腫瘍種・変異率を超えてMYC転写標的のほぼ全例での変化が確認された。
考察/結論
本研究は224例の大腸癌検体を対象とした多次元ゲノム統合解析によりCRCの包括的分子プロファイルを確立したものであり、これまでの研究とは異なり、変異・コピー数・メチル化・発現の全データを統合して経路レベルの構造を初めて明確に記述した点で革新的な位置づけにある。
先行するVogelsteinモデル (APC→KRAS→SMAD4→TP53 の腺腫-癌配列) はCRC発症の枠組みを提供してきたが、本研究はこれまでの研究が示せなかった個別遺伝子異常を超えた経路レベルの多重変化の全容を示した。既報の大規模配列解析 (Sjoblom et al. 2006; Wood et al. 2007) と対照的に、本研究は多次元データ統合という方法論的優位性により、相互排他的変異パターンや経路内多重病変の蓄積という重要な生物学的構造を初めて定量的に明確化した。また、結腸癌と直腸癌が臨床的に異なる管理を要するにもかかわらず、non-hypermutated腫瘍はゲノムレベルでは区別不能であることを示した点も既報とは相違する重要な発見であり、両者を統合解析する生物学的根拠を初めて提示した。一方、右側結腸の腫瘍のみがhypermutatedかつCIMP-highという特性を持つことは、発生学的起源 (胚性中腸・後腸の境界) との関連を示唆する知見として今後の探索的研究課題を提起している。
本研究で初めて、SOX9がCRCにおいて高頻度に機能喪失型変異を呈する新規ドライバー遺伝子として同定された。これまで報告されていない知見として、NAV2-TCF7L1融合遺伝子の同定とTCF/LEF因子群の多様な変化 (計16種の遺伝子) が示されたこと、ならびにIGF2過剰発現とPI3K経路活性化変異が相互排他的という新規な分子モデルも重要な発見である。FAM123B (WTX) やARID1AがCRCの新規ドライバーとして位置づけられたことも本研究で初めて体系的に示された。
本知見の臨床的意義は複数の層で認識される。MSI-H (high microsatellite instability) を呈するhypermutated腫瘍 (16%) は後の臨床試験で免疫チェックポイント阻害薬への高い感受性が示されており、hypermutated群でのMSI-H検出率は77% (n=23/30、95% CI 58-89%) と高く、本論文の分子分類はその治療選択根拠となる患者層別化の基盤を提供した。免疫細胞密度と局在がCRCの転帰予測に直結することも示されており (Galon et al. Science 2006)、MSI-H腫瘍の高免疫原性との関連が注目される。ERBB2増幅が4%の症例に確認されたことはHER2陽性乳癌・胃癌でのトラスツズマブ治療の経験を踏まえCRCへの臨床応用の可能性を示唆するものであり、実際にその後の臨床試験でCRCにおけるHER2標的療法の有効性が示されている。KRASおよびBRAF変異の体系的分類はEGFR指向性療法に対する抵抗機序の層別化にも直結し (Bertotti et al. Nature 2015)、本研究が提示した変異ランドスケープがその基盤として機能する。IGF1R阻害薬やWNT阻害薬、PI3K (phosphoinositide 3-kinase) 経路阻害薬など複数の新規分子標的療法に対して、治療選択のバイオマーカーとなりうる分子異常サブセットを体系的に提示したことも臨床的含意が大きい。bench-to-bedsideの観点から、RAS経路とPI3K経路の共活性化が1/3の腫瘍に認められることは、単剤阻害の限界を示唆し両経路の同時阻害が必要となりうることを示唆する。
残された課題として、hypermutated腫瘍がなぜ右側結腸に集積するかの発生学的機序の解明が今後の研究として挙げられる。SOX9・FAM123B・ARID1A変異がWNT活性化に機能的に寄与する詳細な機序、RAS/PI3K二重阻害の臨床的有効性の検証、IGF2-IGF1R-IRS2-PI3Kシグナル軸のより詳細な分子機序の解明もlimitationとして残された。本研究は主に前向きコレクション由来の検体を使用したため生存データが得られず、同定された分子シグネチャーの予後予測値を検証することが将来の重要課題である。WNT経路阻害薬・IGF1R阻害薬・ERBB2標的療法を含む多数の治療アプローチの臨床的有用性の実証も今後の検討に委ねられている。
方法
224組の腫瘍-正常ペアを対象にexome sequencing (全エクソンシーケンシング) を実施した。Illumina HiSeqおよびSOLiDプラットフォームを用い、ターゲットエクソンの80%以上で20倍以上のシーケンスカバレッジを達成した。体細胞変異の有意性評価にはMutSigアルゴリズムと手動キュレーションを使用した。257例のAffymetrix SNP 6.0アレイによるSCNA (somatic copy-number alteration; 体細胞コピー数異常) 解析を実施し、GISTIC (genomic identification of significant targets in cancer) アルゴリズムにより焦点的コピー数異常の遺伝子標的を同定した。97例の検体では低深度WGS (whole-genome sequencing; 約3〜4倍カバレッジ、物理カバレッジ7.5〜10倍) を実施し、SCNAと染色体転座の検出に用いた。
DNAメチル化プロファイリングは236例にIllumina Infinium HumanMethylation27/450アレイで実施しCIMP評価と4サブグループ分類を行った。mRNA発現解析にはAgilentマイクロアレイおよびRNA-Seq、miRNA発現にはmiRNA-Seqを使用した。機能検証には大腸癌cell line DLD-1 (ATCC CCL-221) およびHCT 116 (ATCC CCL-247) を用いたin vitro実験を実施した。
統計解析として、2群間の変異頻度比較にはFisher’s exact test (フィッシャー正確検定) を適用した。連続変数の相関評価にはPearson correlation (ピアソン相関係数) を使用した。相互排他的変異パターンの評価にはMEMo (Mutually Exclusive Modules) アルゴリズムを、パスウェイ統合解析にはPARADIGM (Pathway Recognition Algorithm using Data Integration on Genomic Models) を使用した。バッチ効果はPCA (principal component analysis; 主成分解析) とANOVA (analysis of variance; 分散分析) で評価した。全シーケンスデータはdbGaP (database of Genotypes and Phenotypes; study accession phs000178) に寄託し、付随データはTCGA DCC (data coordinating center) を通じて公開した。