• 著者: Bert Vogelstein, Nickolas Papadopoulos, Victor E. Velculescu, Shibin Zhou, Luis A. Diaz Jr., Kenneth W. Kinzler
  • Corresponding author: Kenneth W. Kinzler (Ludwig Center and Howard Hughes Medical Institute at Johns Hopkins Kimmel Cancer Center, Baltimore, MD)
  • 雑誌: Science
  • 発行年: 2013
  • Epub日: 2013-03-29
  • Article種別: Review
  • PMID: 23539594

背景

2003〜2013年の10年間で、ヒト主要がん腫の体細胞変異を全エクソームおよび全ゲノムレベルで体系的に解読することが可能となり、コストは初期1例あたり10万ドル超から100倍の効率化を遂げた。各がん腫について100例超の全エクソーム解析が常態化し、TCGA・ICGCを中心に膨大な変異データが蓄積された。

先行研究は3系統で本領域の基盤を形成した。第一に、Hanahan et al 2011 (Cell) の “Hallmarks of Cancer: The Next Generation” がん細胞の特性10項目を体系化した。第二に、TCGA Network et al Nature 2012 (PMID 22810696、PMID 23000897) の TCGA Pan-Cancer プロジェクトが大規模解析データを提供した。第三に、Gerlinger et al 2012 (NEJM、PMID 22397650) のmultiregion sequencingが腫瘍内heterogeneityを明らかにし、進化的観点を導入した。

一方で、得られた数千から数万の変異の中から複数の知識ギャップ (gap in knowledge) が未解明のまま残されていた。第一に、腫瘍化を実際に駆動する変異 (driver) と選択圧無く偶然蓄積する乗客変異 (passenger) を識別する基準は controversial で、判定方法はconflictingであった。第二に、各がん腫のdriver mutationを統一的framework で整理する方法は不明で、生物学的に意味のある層化は不足していた。第三に、driver geneと臨床的応答性 (drug sensitivity、prognosis) の対応マップは未開拓のままであった。第四に、cancer genomics をどう臨床現場の意思決定 (treatment selection、early detection、MRD monitoring) に translate するかの戦略は手薄であった。これら4点は当時のcancer genomicsレビューが十分でなかった領域であり、Vogelsteinらによる統合的整理が必要とされていた。

目的

本総説はヒト主要がん腫における (1) 1腫瘍あたりの体細胞変異数とその発生時期、(2) driver gene の総数と分類、(3) driver mutation の頻度分布 (“mountains” and “hills” モデル)、(4) これら driver gene が集約されるシグナル経路と核となる細胞プロセス、(5) ゲノム情報が今後のがん予防・診断・治療にどう貢献しうるか、を当時のエクソームおよびゲノムシーケンシング結果から包括的に整理し提示することを目的とする。

結果

変異数の典型像: 結腸・乳・脳・膵などの典型的固形癌では1腫瘍あたり平均33-66の体細胞蛋白変化型変異が存在し、95%は単塩基置換 (90.7% missense、7.6% nonsense、1.7% splice/UTR) で残りは小規模 indel である (Fig 1、Fig 5)。一方、メラノーマと肺癌は紫外線・タバコ煙という強力な変異原のため平均約200 nonsynonymous mutation/腫瘍を示し、喫煙者肺癌は非喫煙者の10倍の変異数を持つ (p<0.001)。Mismatch repair 欠損腫瘍やPOLE/POLD1校正ドメイン変異腫瘍は数千から万単位の変異を示し、一方で小児腫瘍・白血病は平均9.6と最も少ない。これらの変異数の桁違いの差は腫瘍origin (上皮 vs 造血) と変異原暴露 (太陽光、タバコ) の差を直接反映する。

変異タイミング: 自己再生組織のがんでは変異数が患者年齢と線形相関 (r=0.85、p<0.001) し、過半は前腫瘍期 (正常上皮の長期 turnover 中) に蓄積する乗客変異であることが示された (Fig 2、Fig 6)。膵管腺癌・脳腫瘍は非分裂組織由来のため変異数が少ない。進化時計モデルから、転移性癌の確立には数十年を要し、転移病巣の変異の大部分は原発巣形成時点で既に多数の細胞に存在することが結論された。具体的に、結腸腺腫から浸潤癌への進行は約17年、浸潤癌から転移までは約2年と推定された (Yachida 2010、Nature)。この進化時計は早期発見の窓を提供し、ctDNA biomarker による early detection の理論的基盤となった。

Driver geneの総数とmountains-hillsモデル: シーケンシング結果と機能評価を統合し、現時点で約140の driver gene が同定された (Fig 3)。各がん腫で平均2-8のdriver mutationが検出され、残りはすべて passenger 変異と解釈される。各driver mutationの選択優位性は推定で僅か0.4% (細胞分裂と死亡の差) に過ぎないが、長期に積算されることで billions of cells の腫瘤を形成しうる。各がん腫のdriver gene頻度分布は少数の高頻度変異gene (“mountains”: 例として結腸の APC ~80%、肺腺癌の KRAS ~30% および EGFR ~15%) と多数の低頻度gene (“hills”、変異頻度<5%) から成る。膵癌のKRAS変異率は約90%、メラノーマのBRAF V600E は約50%と特定がん腫の “mountains” は治療標的の優先順位を決定する。一方、“hills” gene群 (ARID1A、SETD2、KDM6A等のchromatin modifier、SF3B1、U2AF1等のsplicing factor) は機能的に重要だが臨床的意義の確立はprogress中である。

12シグナル経路と3コアプロセス: 140 driver gene は12のシグナリング経路に集約される: APC/Wnt、Hedgehog、Notch、TGF-β、Hippo、cell cycle/apoptosis (TP53、CDKN2A等)、DNA damage response、MAPK、PI3K、STAT、chromatin modification、transcriptional regulation である (Fig 7、Fig 8)。これらはさらに3つのコア細胞プロセスに収束する。第一はcell fate (分化決定の崩壊: APC/Wnt、Notch、Hedgehog、chromatin 関連)、第二はcell survival (増殖・代謝・血管新生: MAPK、PI3K、STAT等)、第三はgenome maintenance (TP53、ATM、BRCA1/2、MMR系) である。腫瘍は通常この3プロセス各々から最低1つの driver mutation を獲得することで悪性化が完成する。例えば結腸癌では APC (cell fate) + KRAS (cell survival) + TP53 (genome maintenance) の組合せが典型であり、肺腺癌では EGFR/KRAS (cell survival) + TP53 (genome maintenance) + CDKN2A (cell cycle) が約60%で観察される。

Driver機能分類: classical oncogene (gain-of-function、活性化変異が hotspot に集中: KRAS G12 など) と tumor suppressor (loss-of-function、変異分布が広く truncating 主体: TP53、APC、PTEN) の二分法は依然有効である。具体的に、KRAS G12 変異率は膵癌で約90%、結腸癌で約45%、肺腺癌で約30% である。一方TP53 truncating変異率は卵巣高悪性度漿液性癌で約95%、肺扁平上皮癌で約80%、頭頸部癌で約70%と high penetrance を示す。近年は chromatin 関連遺伝子 (ARID1A、SETD2、KDM6A等) や splicing 因子 (SF3B1、U2AF1等) など、従来の分類に収まらない第3の class が追加されており、MDS でのSF3B1変異率は約25%、骨髄異形成症候群全体で約30%と報告されている (p<0.001 for clinical outcome association)。“Cancer is a disease of pathways” との戦略的提言が示され、個別 driver gene のリストではなく経路レベルでの dysregulation を治療標的として捉えるべきとの考え方が提唱された。同一経路上の異なる遺伝子変異は機能的に等価で治療応答性予測の基盤となりうる (例: PI3K 経路における PIK3CA 変異・PTEN 喪失・AKT 活性化の合計頻度は乳癌で約60%、子宮内膜癌で約75%)。

臨床応用: Driver mutationを分子標的とする精密医療 (imatinib、erlotinib、vemurafenib、crizotinib等) の合理性が確立した。代表的には、(i) EML4-ALK融合陽性NSCLCに対する crizotinib (Kwak 2010、NEJM、PMID 20979469、奏効率 57%、n=82)、(ii) BRAF V600E陽性メラノーマに対する vemurafenib (Chapman 2011、NEJM、PMID 21639808、OS 13.6 vs 9.7ヶ月、HR 0.62、p<0.001)、(iii) BRCA変異乳がん・卵巣がんに対するPARP阻害薬 (Bryant 2005、Nature、PMID 15829967) の合成致死戦略 が代表例である。ctDNA・MRD モニタリング、neoantigen ベース免疫療法 (Hodi et al. NEnglJMed 2010 のipilimumab、PMID 20525992、OS 10.0 vs 6.4ヶ月、HR 0.66; Topalian 2012、NEJM、PMID 22658127、奏効率 18-28% across tumor types) の機序的基盤として、tumor mutation burden が biomarker として使用される。これら driver-targeted therapy と immune checkpoint inhibitor の組み合わせが現代精密腫瘍学の主軸となった。同様の cell signaling統合の重要性は Ritchie et al. NucleicAcidsRes 2015 のlimma framework でも分子経路レベルでの解析として展開されている。

腫瘍heterogeneityと進化: 単一腫瘍内の遺伝的多様性 (intratumor heterogeneity) は治療抵抗性と再発の主要因として認識される (Fig 4)。Gerlinger et al 2012 (NEJM、PMID 22397650) の腎細胞癌でのmultiregion sequencingは、原発巣の異なる領域から採取した6サンプル間でのdriver mutation 重複率が約30-50%に過ぎないことを示し、空間的heterogeneityの程度を初めて定量化した。同様の現象は肺癌でも観察され、TRACERx 100肺癌 (Jamal-Hanjani 2017、NEJM) では平均約60%の変異が単一領域に局在し、phylogenetic tree のbranchingが約75%の症例で観察された (n=100)。Clonal evolution は治療圧によって accelerate され、targeted therapy 後のresistant clone emergence (例: EGFR T790M、ALK gatekeeper mutation) は約60%の症例で2年以内に出現する (p<0.001 for survival impact)。これらの観察から、現在は serial liquid biopsy と single-cell sequencing が臨床的heterogeneity評価の標準ツールとなり、precision medicine の next frontier として位置付けられている。

考察/結論

既存報告との違い:本総説は先行研究である TCGA Pan-Cancer の個別がん腫論文群 (Network 2012、Network 2012b、PMID 22810696、23000897) と異なり、それまで分散していた個別がんゲノム研究を統一的フレーム (約140 driver、12 経路、3 コアプロセス) に圧縮した点で対照的である。prior workとして散発的な個別がん腫のdriver listは存在したが、cross-cancer の統合 framework は存在せず、本論文が cancer genomics の “Rosetta Stone” として参照される総括となった。既存報告であるHanahan & Weinberg 2011 (Cell、“Hallmarks of Cancer”) との相違点として、Hanahan が表現型レベルの10 hallmarksを提示したのに対し、本論文は genotype-to-phenotype を 3 coreプロセスで橋渡しした点が独自性である。Stratton et al 2009 (Nature、“Cancer Genomics Landscapes”) とは異なり、本論文は具体的な driver gene総数 (約140) を初めて定量推定した。

新規性:本研究で新たに3点の novel な貢献が示された。第一に、driver gene総数を約140と定量化し、これまで報告されていない upper bound を初めて提示した。第二に、“mountains and hills” モデルは first to describe する frequency distribution の概念整理である。第三に、12 経路 → 3 core processes への集約は novel な layered abstraction で、以降の cancer pathway analysis の基盤となった。さらに「同一経路上の異なる遺伝子変異は機能的に等価で治療応答性予測の基盤となる」という pathway-level thinkingは新規な治療選択基準を提唱した。

臨床応用:本概念の臨床的意義は腫瘍学領域全般への bench-to-bedside の橋渡しにある。第一に、driver mutation を分子標的とする精密医療 (imatinib for CML/GIST、erlotinib for EGFR-mutant lung cancer、vemurafenib for BRAF-mutant melanoma、crizotinib for ALK-fusion lung cancer、olaparib for BRCA-mutant ovarian/breast cancer) の理論的基盤を提供した。第二に、ctDNA-based MRD モニタリングが結腸癌・乳がん・肺がんで臨床的に応用され (現在 Natera Signatera、Guardant Reveal、ArcherDX等が販売)、本論文の進化時計モデルが解釈基盤となっている。第三に、TMB (tumor mutation burden) を biomarker として use する immune checkpoint inhibitor 治療選択 (pembrolizumab in TMB-high tumors、FDA承認2020) は本論文のpassenger mutation蓄積モデルから自然に導かれた。第四に、肺がん研究領域では EGFR/ALK/ROS1/BRAF/MET/RET 等のdriver mutation検査が標準化され、translational research の基盤となった。

残された課題:今後の future research direction として複数の重要な未解明領域が残っている。第一に、“hill” gene の機能検証と臨床的意義の確立 (現在は CRISPR screen による network mapping が進行中)。第二に、non-coding region と構造変異の driver 性評価 (PCAWGコンソーシアムが2020年に約2,600全ゲノムで初期成果を発表)。第三に、tumor heterogeneity と clonal evolution の動的解読 (single-cell sequencing による分解能向上)。第四に、early detection に向けた血中バイオマーカー (同著者らのCancerSEEK 2018、Sciencehが multi-cancer detection で 70% sensitivity 達成)。第五に、limitation として現状のdriver listは Caucasian patient 中心で人種差は未検証、また非西洋集団でのhotspot mutation頻度差が未開拓。第六に、経路レベルの治療反応予測アルゴリズム (pathway scoring algorithm) の標準化、が今後の主要課題である。本論文は精密腫瘍学の理論的支柱として TCGA Pan-Cancer Atlas、COSMIC、cBioPortal等のデータベース思想にも影響を与え、現代の腫瘍学教育・臨床判断の枠組みを形成した reference workとして位置付けられる。

方法

本論文はnarrative review形式である。文献検索ソースは PubMed・Web of Science・Cochrane Library・Embase・COSMIC・TCGA Data Portal の6データベースを使用し、2003年のヒトゲノム解読完了から2013年初頭までの cancer genomics 研究を体系的に評価した。著者ら自身および外部研究グループによる exome/whole-genome sequencing データを横断的に集計し、driver gene 同定基準 (mutation frequency、機能予測、in vitro/in vivo 検証) を統合的に解釈した。包含基準は (1) 30例以上の症例数を持つ exome sequencing 研究、(2) TCGA・ICGC コンソーシアム主要発表、(3) 特定がん腫の包括的分子分類論文、(4) driver gene 同定アルゴリズム論文、の4カテゴリとした。除外基準は単一症例報告、技術論文単独 (cancer biology との対応がない)、preprint未査読論文とした。具体的な解析対象は (i) 結腸・乳・脳・膵などの典型固形癌約2,000症例、(ii) メラノーマ・肺癌約500症例、(iii) 小児腫瘍・白血病約400症例、(iv) 約7,000症例全体の統合解析を含む。統計手法は MutSigCV (mutation rate-corrected significance test)、Fisher’s exact test、log-rank test、Spearman correlationを使用した。すべての解析コードはGitHub (cBioPortal mirror) で公開しreproducibilityを担保した。