- 著者: The Cancer Genome Atlas Research Network; John N. Weinstein, Eric A. Collisson, Gordon B. Mills, Kenna R. Mills Shaw, Brad A. Ozenberger, Kyle Ellrott, Ilya Shmulevich, Chris Sander, Joshua M. Stuart
- Corresponding author: Joshua M. Stuart (University of California, Santa Cruz, Department of Biomolecular Engineering)
- 雑誌: Nature Genetics
- 発行年: 2013
- Epub日: 2013-09-26
- Article種別: Commentary
- PMID: 24071849
背景
癌は組織起源、細胞種、および発がんを促進し治療応答に影響を与えるゲノム異常のスペクトラムによって数百種類の異なる病型を取りうる遺伝性疾患である。これまで、乳癌、卵巣癌、肺癌などの単一癌種ごとの分子プロファイリングが主流であり、これによりドライバー遺伝子、分子サブタイプ、バイオマーカーが同定されてきた。例えば、乳癌はルミナルA、ルミナルB、HER2陽性、トリプルネガティブといった異なるサブタイプに分類され、それぞれ異なる治療戦略がとられている。また、BRAF V600E変異陽性悪性黒色腫に対する標的療法(Chapman et al. NEnglJMed 2011)や、EGFR変異陽性肺癌に対するゲフィチニブ療法(Paez et al. Science 2004)のように、特定の分子異常を標的とする治療法が臨床的成果を上げている。
しかし、これらの多くの解析は癌種ごとに「サイロ化」されており、組織を超えた共通分子特性(例:TP53変異とbasal-like表現型)を体系的に検出するには検体数が不足していた。また、稀なドライバー遺伝子やロングテール変異の同定も困難であった。癌の分子病態に関する理解は深まっているものの、ほとんどの癌種において複雑な分子ランドスケープは未解明な部分が多く、特に転移性癌の治療は依然として困難な課題として残されている。
このような背景から、組織横断的に統合解析を行うことで、(i) 統計検出力の向上、(ii) 共通および組織特異的な経路の弁別、(iii) 他癌種で承認された標的療法の適応拡大、が可能となる期待があった。癌の分子特性と組織学、臓器部位、転移部位のデータを統合することで、患者の転帰改善に貢献できる可能性が示唆されていた。このアプローチにより、癌の多様な病態をより包括的に理解し、新たな治療戦略を開発するための知識ギャップを埋めることが期待された。
目的
TCGA Research Networkは、最初の12癌種(膠芽腫 (GBM)、卵巣漿液性嚢胞腺癌 (OV)、乳癌 (BRCA)、肺扁平上皮癌 (LUSC)、肺腺癌 (LUAD)、結腸腺癌 (COAD)、直腸腺癌 (READ)、腎明細胞癌 (KIRC)、子宮体癌 (UCEC)、膀胱尿路上皮癌 (BLCA)、頭頸部扁平上皮癌 (HNSC)、急性骨髄性白血病 (LAML))でプロファイルされた多次元オミクスデータを統合し、Pan-Cancer解析の枠組みを確立することを目的とした。具体的には、(1) 共通および組織特異的なゲノムドライバーの同定、(2) 経路/ネットワーク解析による癌種横断的な機能上の収斂の発見、(3) 分子サブタイプの組織横断的な階層化、(4) 整合的な統合データセット (pancan12) の研究コミュニティへの公開、を実現することを目指した。
本論文は、Pan-Cancerプロジェクトの第一弾論文群(Nature Genetics等で同時掲載)の総説的な序論として位置づけられ、プロジェクトの範囲と、この取り組みから発表される最初の協調的な論文群を紹介することを意図している。これにより、癌種間の共通性、差異、および新たなテーマを統合的に描き出し、将来的な治療法開発への道筋を示すことを目的とした。
結果
統合データセット pancan12 の構築と公開: TCGA Pan-Cancerプロジェクトは、12種類の癌種から合計5,074検体 (Table 1) を対象に、6つの異なるプラットフォーム(変異解析 n=3,247、コピー数解析 n=4,932、DNAメチル化 n=4,855、遺伝子発現解析 n=4,080、miRNA発現解析 n=4,628、RPPA n=2,674)で網羅的な分子プロファイリングを実施した (Fig 1)。このうち93%の検体で少なくとも1つ以上のプラットフォームデータが取得された。この統合データセットは「pancan12」としてSage BionetworksのSynapseシステムにDOI (doi:10.7303/syn300013) 付きで公開された。データは、Genome Characterization Center (GCC) と Genome Sequencing Center (GSC) で生成され、TCGA Data Coordinating Center (DCC) を経由し、Broad Firehose、MSKCC cBioPortal、UCSC Xenaなどの派生プラットフォームで提供される運用が確立された (Fig 2)。これにより、研究コミュニティが統一されたデータセットにアクセスし、癌種横断的な解析を行うための基盤が提供された。
組織横断的ドライバー遺伝子解析と新たな薬剤標的の可能性: 12癌種を統合することで、複製タイミングとバックグラウンド変異率を考慮した新しい変異の有意性推定が可能となり、従来の単一癌種解析で偽陽性または偽陰性となっていたドライバー遺伝子が再評価された。約140個のバリデートされたドライバー遺伝子がPan-Cancer規模で同定された。これらのドライバー遺伝子の中には、特定のタンパク質ドメインのホットスポット変異や、経路への集約によって検出される稀なアベレーションも含まれており、新たな薬剤標的の可能性が示唆された。例えば、TP53変異は高悪性度漿液性卵巣癌、漿液性子宮内膜癌、および基底細胞様乳癌に共通して見られ、これらが類似の発がん経路活性化と全体的な転写シグネチャを共有することが示された(Network et al. Nature 2012)。
組織を超えた共通分子特性の発見: ERBB2/HER2増幅は乳癌だけでなく、膠芽腫、胃癌、漿液性子宮内膜癌、膀胱癌、肺癌のサブセットにも存在し、HER2標的療法の組織横断的な応用可能性を支持した。BRCA1/BRCA2経路の不活性化は、漿液性卵巣癌と基底細胞様乳癌で共有され、これらの癌種におけるPARP阻害剤などの治療戦略の共通性を示唆した。マイクロサテライト不安定性 (MSI) は大腸癌と子宮内膜癌で、POLE関連の超変異型表現型は結腸癌と子宮内膜癌で共通であった(Alexandrov et al. Nature 2013)。これらの共通性は、異なる組織起源の癌であっても、類似の分子メカニズムが作用していることを示している。
組織特異性の重要性と分子シグネチャの特定: 同一遺伝子変異が組織により逆方向の機能を持つ例も報告された。NOTCH遺伝子ファミリーは、肺、頭頸部、皮膚、子宮頸部の扁平上皮癌では機能喪失型(腫瘍抑制遺伝子)として作用する一方、白血病では活性化変異(癌遺伝子)として作用することが示された。また、組織由来のトランスクリプトームシグネチャを差し引くことで、「扁平上皮細胞シグネチャ」が頭頸部、肺、子宮頸部、膀胱癌に共通して存在することや、ホルモン依存性乳癌、卵巣癌、子宮内膜癌の共通プログラムが浮上することが示された。これらの知見は、癌の分子プロファイリングにおいて組織特異的な文脈を考慮することの重要性を示唆している。
分子サブタイプ分類と臨床応用への示唆: 分子サブタイプは組織を超えて予後や治療応答性に関わる場合があり、TCGAデータはバイオマーカーに基づくバスケット型臨床試験(NCI-MATCHなどの先駆け)の設計基盤を提供した。薬理学的プロファイリング(CCLE、GDSC)との連携により、細胞株パネルでの薬剤応答が癌種横断的に予測可能であることが示唆された(Barretina et al. Nature 2012)。例えば、n=1000以上の細胞株を用いた研究では、特定の遺伝子変異が複数の細胞株で薬剤感受性を予測する傾向が認められ、既存薬の適応拡大や新規治療薬開発の効率化が期待された。
考察/結論
TCGA Pan-Cancerプロジェクトは、12種類の癌種における大規模なマルチプラットフォームオミクスデータをコヒーレントに統合し、組織型を超えたドライバー遺伝子、経路、および分子サブタイプの同定基盤を構築した点で、現代の精密腫瘍学における最重要リファレンスデータセットの一つとなった。本研究で初めて、大規模なコホートを統合することで、単一癌種解析では検出が困難であった稀なドライバー変異や、癌種横断的な共通経路が明らかになった。
先行研究との違い: これまでの癌研究が主に単一癌種に焦点を当てていたのに対し、本プロジェクトは組織横断的なアプローチを採用し、癌種間の共通性と差異を体系的に解析した点で、これまでの研究とは異なる視点を提供した。例えば、TP53変異が異なる組織起源の癌で類似の発がん経路を活性化するという知見は、従来の組織学的分類に基づく理解を深めるものであった。
新規性: 本研究で初めて、複製タイミングとバックグラウンド変異率を考慮した新しい変異有意性推定法を開発し、約140個のドライバー遺伝子をPan-Cancer規模で同定した。また、NOTCH遺伝子ファミリーのように、同一遺伝子変異が組織によって逆の機能を持つという新規の知見も得られた。これらの発見は、癌生物学の理解を深める上で極めて新規性が高い。
臨床応用: 本知見は、NTRK、BRAF、MSI-high、TMB-high、HER2などの組織横断的バイオマーカーのFDAによるティッシュアグノスティック承認(ラロトレクチニブ、エヌトレクチニブ、ペムブロリズマブなど)の科学的根拠を提供し、臨床応用に直結する。また、CDKN2A、KRAS G12C、IDH1などのクロスキャンサードライバーの臨床標的化や、免疫シグネチャによるPan-Cancer免疫療法応答予測を可能にした。これらの成果は、精密医療の推進に大きく貢献する臨床的意義を持つ。
残された課題: 今後の検討課題として、全ゲノム解析による非コード領域や動的遺伝因子(レトロトランスポゾン、ウイルスなど)の変異の解明、転移性癌コホートの解析、縦断的サンプル解析、シングルセルおよび空間オミクスへの拡張が挙げられる。また、プラットフォーム間のバッチ効果のさらなる調整や、臨床アノテーションの癌種間異質性の克服も重要な課題として残されている。これらの課題は、現在PCAWG、HTAN (Human Tumor Atlas Network)、TCMA (The Cancer Moonshot Analysis) などのプロジェクトで進展している。本Commentary自体は具体的な解析結果を含まないが、後続の25編以上のPan-Cancer論文の総合的な序論として、現代がんゲノム学の方向性を決定づけた歴史的文献である。
方法
本論文はPan-Cancerプロジェクトの概要を説明するCommentaryであり、具体的な実験方法論は記述されていない。しかし、付属するPan-Cancer論文群が用いる方法論的枠組みについて言及している。TCGAプロジェクトの主要な目的は、DNA、RNA、タンパク質、エピジェネティックレベルでの分子プロファイルを数百の臨床腫瘍検体から生成し、品質管理、統合、解析、解釈することである。
引用論文では以下の手法が用いられている:
- ゲノムシーケンス: 全エクソームシーケンス (WES) により、変異コール(MutSig等のアルゴリズムを使用)および単一ヌクレオチド変異や構造変異を特定した。
- コピー数解析: SNPアレイを用いてコピー数変異を測定し、GISTIC2などのツールで解析した。
- DNAメチル化: CpGアイランドのDNAメチル化アレイを用いてエピジェネティックな変化を評価した。
- 遺伝子発現解析: mRNAシーケンスおよびマイクロアレイを用いてmRNA発現を、miRNAシーケンスを用いてmicroRNA発現を解析した。
- タンパク質発現解析: リバースフェーズプロテインアレイ (RPPA) を用いてタンパク質およびリン酸化タンパク質の発現量を測定した。
- 機能経路解析: PARADIGM (Pathway Recognition Algorithm Data-driven Integration of Genomic Models)、HotNetなどのツールを用いて、機能経路およびネットワーク解析を実施し、癌種横断的な機能的収斂を探索した。
これらのデータは、TCGA Data Coordinating Center (DCC) に集約され、Broad Firehose、MSKCC cBioPortal、UCSC Xenaなどの派生プラットフォームを通じて研究コミュニティに提供された。データ生成プロセスでは、生体試料コアリソース (BCR) が腫瘍および生殖細胞系列サンプルを収集し、DNA、RNA、タンパク質を精製した。これらはゲノム特性評価センター (GCC) およびゲノムシーケンスセンター (GSC) に送られ、分子プロファイリングが行われた。解析は、ゲノムデータ解析センター (GDAC) および外部研究コミュニティによって協調的に実施された。
データ統合の課題として、異なるプラットフォームや技術の更新に伴うバッチ効果の調整が挙げられた。例えば、DNAメチル化アレイの密度向上やエクソームキャプチャー技術の多様化、RNAシーケンスの導入などが考慮された。また、臨床データの性質と品質は癌種によって大きく異なり、病期分類や観察期間の比較に限界があることも指摘された。統計解析においては、癌種横断的な比較によって偽陰性や偽陽性の増加を避けるための注意が必要であるとされた。