• 著者: Stratton MR, Campbell PJ, Futreal PA
  • Corresponding author: Michael R. Stratton (Wellcome Trust Sanger Institute)
  • 雑誌: Nature
  • 発行年: 2009
  • Epub日: N/A
  • Article種別: Review
  • PMID: 19360079

背景

がんが細胞ゲノムのDNA配列変化に起因するという基本認識は、19世紀後半から20世紀初頭のDavid von HansemannやTheodor Boveriによる異常な染色体観察に端を発し、DNAの発見と構造解明を経て確立された。1970年代には、慢性骨髄性白血病におけるフィラデルフィア染色体(9番と22番染色体の転座)のような特定のゲノム異常が特定のがん種と関連することが示された Rowley et al. Nature 1973。そして1982年、HRAS遺伝子における最初のヒトがん体細胞変異(G→T置換)が同定され、がん遺伝子探索の時代が幕を開けた。この発見以来、350以上のがん遺伝子が同定されてきたが、個々のがんの完全な変異カタログを得るには、ヒトゲノム参照配列の完成(2004年)と次世代シークエンシング(NGS)技術の実用化という二つの技術的ブレークスルーが不可欠であった。2009年当時、複数の全ゲノムがんシークエンシングプロジェクトが開始され始めており、急性骨髄性白血病(AML)の全ゲノム完全配列が初めて報告された。しかし、がんゲノムの包括的な理解には、数千から数万のがんゲノムを解析する大規模な国際協調体制が不可欠であるという認識が広がり、同年、国際がんゲノムコンソーシアム(ICGC: International Cancer Genome Consortium)が設立された。本レビューは、このパラダイムシフトの時代に、がんゲノム研究の理論的基盤を集約した先駆的総説として位置付けられる。著者のStratton、Campbell、FutrealはいずれもWellcome Trust Sanger InstituteのCancer Genome Projectに所属し、COSMIC(Catalogue of Somatic Mutations in Cancer)データベースの構築・運用にも携わる第一線研究者であり、がんゲノム研究の最前線で得られた知見を統合し、今後の方向性を示すことを目的としている。これまでの研究では、特定のがん遺伝子に焦点を当てた解析が主流であったため、がんゲノム全体にわたる体細胞変異の多様性や、ドライバー変異とパッセンジャー変異の区別に関する体系的な理解が不足していた。特に、低頻度で変異するがん遺伝子の同定や、がん進化における変異の蓄積過程の全貌は未解明な部分が多く、次世代シークエンシング技術の登場がこれらのギャップを埋める可能性を秘めていた。

目的

本レビューの目的は、がんゲノム研究の現状と将来の展望を包括的に提示することである。具体的には、以下の点を統合的に論じることを目指す。(1) がんが細胞集団における遺伝的変異の連続的獲得と自然選択というダーウィン進化プロセスであるという基本原理を強調する。(2) がんゲノムに蓄積される体細胞変異の構造的クラス分類と、その多様性を概説する。(3) ドライバー変異とパッセンジャー変異の概念的枠組みを明確にし、その識別戦略の重要性を提示する。(4) 既知のがん遺伝子レパートリーの現状と、全ゲノム解析によって明らかになるであろう全体像を推定する。(5) 次世代シークエンシング技術を用いた早期のがんゲノムシークエンシング研究の成果を報告する。(6) 大規模なゲノム解析時代に向けた国際がんゲノムコンソーシアム(ICGC)の使命と、個別化医療への応用を含む将来の展望を提示する。これらの目的を通じて、がんゲノム研究の新たな時代における理論的基盤と実践的な方向性を示すことを意図している。

結果

がんはダーウィン進化プロセスである: すべてのがんは、細胞集団における遺伝的変異の連続的獲得と自然選択というダーウィン進化の産物である。体細胞変異は正常細胞の分裂時にも低率で蓄積し(内因性変異原、外因性変異原、DNA修復エラーによる)、十分な数の適応的変異が蓄積した細胞が自律的増殖、組織浸潤、遠隔転移の能力を獲得してがんとなる。成人の体内には何千もの軽微な「勝者」細胞が恒常的に存在するが、大半は増殖能力が限られており皮膚色素母斑のような良性病変に留まる。極めてまれに、単一細胞が十分に適応的な変異セットを獲得してがんへと進展する。この枠組みは、がん進化が「モノクローナルな選択」を経ることを意味し、治療抵抗性の出現(耐性変異を持つサブクローンの選択)も同じ原理で説明される (Figure 1)。一般的な上皮がん(乳癌、大腸癌、前立腺癌等)では5〜7個のrate-limiting driverが必要とする年齢-罹患統計モデルがあるが、全ゲノムシークエンシングデータでは個々のがんに最大20個のdriverが存在する可能性も示唆されており(n = 数十例の初期全ゲノム解析)、driver数の真の範囲は今後の大規模データで確定される予定である。

体細胞変異の構造的クラスと変異数の多様性: がんゲノムに蓄積される体細胞変異は構造的に多様であり、(1) 塩基置換(単塩基置換 = 点変異)、(2) 挿入/欠失(小〜大規模)、(3) 再配置(融合遺伝子、逆位、転座)、(4) コピー数変化(増幅、欠失、ヘテロ接合性の消失)の4クラスに分類される (Figure 2)。がん細胞ゲノムにはウイルス配列(HPV、EBV、HBV、HTLV-1、HHV-8 (Human herpesvirus 8))が組み込まれる場合もある。変異数はがん種、変異原暴露量、DNA修復能によって大きく異なり、タバコ曝露による肺がんやUV曝露による皮膚がんでは100,000個以上の点変異を持つ例があり、他のがんでは1,000個未満にとどまる場合もある。乳がんの一部ではC→G置換がチミン直後のシトシンに集中するという特徴的な変異シグネチャーが観察され、未知の変異原またはミューテーターフェノタイプの存在が示唆された(後にAPOBECファミリー脱アミノ酵素活性と同定)。テモゾロミド(DNAアルキル化剤)治療後の神経膠腫再発例では、アルキル化剤特有の変異シグネチャーを持つ大量の変異が新規に検出され、単一の薬剤耐性細胞がクローナル拡大して再発を形成することが示された。

ドライバーとパッセンジャー変異の概念(Box 1): がんゲノムの変異はその機能的役割から「ドライバー」と「パッセンジャー」に二分される。ドライバー変異はがん細胞に成長優位性を与え、がん進化において正の自然選択を受けた変異であり、定義上すべてがん遺伝子に存在する。パッセンジャー変異はドライバーが獲得された際にすでにゲノム内に存在していた中立的変異であり、クローナル拡大に乗じて全がん細胞に共有されるが、がん発生には寄与しない。ほとんどのがんゲノムではパッセンジャーがドライバーを数十〜数百倍上回る。全ゲノムシークエンシングでのドライバー同定には、変異頻度の期待値との統計的比較、機能的解析、大規模サンプルによる再現性確認が必要となる。重要な点として、治療抵抗性変異の多くは元来パッセンジャーとして存在していたが、治療圧下でドライバーに転換してサブクローンが優先拡大し、再発として顕在化する(例: CML/イマチニブ抵抗性におけるBCR-ABL T315I変異)。

がん遺伝子レパートリーの現状: ヒトゲノムの約22,000個のタンパク質コード遺伝子のうち、再発的体細胞変異を示すがん遺伝子として同定されているものは約350個(1.6%)(本論文執筆時点、COSMICデータベース)である。同定方法別では、(a) 細胞遺伝学的解析による染色体再配置の検出(特に白血病・リンパ腫)、(b) NIH3T3細胞への形質転換活性を指標とした生物学的アッセイ、(c) 系統的なPCRによる変異スクリーニング、(d) 遺伝性腫瘍の連鎖解析(BRCA1/2、APC等)と分類できる。活動形式は約90%が優性(単一アレル変異で機能獲得・活性化)約10%が劣性(両アレル変異で機能喪失 = 腫瘍抑制遺伝子)。プロテインキナーゼが特に多く含まれており(EGFR、HER2、BRAF、PIK3CA、ALK、KIT、ABL等)、多くが薬剤標的として臨床応用されている。一方、マウスを用いた挿入変異誘発スクリーニングでは2,000以上の遺伝子が変異によりがん化に寄与しうることが示唆されており、ヒトのがん遺伝子レパートリーは現在の350個よりはるかに大きい可能性がある。特に不活性化型(劣性)がん遺伝子の同定は優性活性化型と比較して困難であり、多くが未発見のまま残っている。

変異パターンの支配的傾向: 優性がん遺伝子では変異の種類と位置が制限される傾向がある。ミスセンス変異、インフレーム挿入/欠失、遺伝子増幅が代表的で、特定のホットスポット残基(例: KRAS G12/G13、BRAF V600、PIK3CA E545/H1047)に集中する。劣性がん遺伝子(腫瘍抑制)では塩基置換、フレームシフト、遺伝子欠失、LOHなど多様な不活性化変異が見られる。MAPK/ERK経路上では受容体チロシンキナーゼ(EGFR、ERBB2、FGFR1〜3、PDGFRA/B)から細胞質成分(NF1、PTPN11 (protein tyrosine phosphatase non-receptor type 11)、HRAS、KRAS、NRAS、BRAF)まで多数のがん遺伝子が同定されており、神経膠腫ではほぼすべての症例でこの経路上のいずれかの遺伝子に変異が存在するという包括的証拠が示された TCGA et al. Nature 2008

早期がんゲノムシークエンシングの成果: コーディングエクソンの大規模スクリーニングにより、BRAF(黒色腫60%) Davies et al. Nature 2002、PIK3CA(乳癌・大腸癌)、EGFR(肺腺癌) Paez et al. Science 2004、HER2 Stephens et al. Nature 2004、JAK2(骨髄増殖性腫瘍)、UTX (Ubiquitously transcribed tetratricopeptide repeat on chromosome X)、IDH1(神経膠腫)等のがん遺伝子が発見された。IDH1の発見は特に重要で、代謝酵素(クエン酸回路のイソクエン酸脱水素酵素)が神経膠腫のがん遺伝子であるという予想外の知見であり、体系的スクリーニングなしには発見不能だった。全ゲノムシークエンシングの初成果としてAML(急性骨髄性白血病)全ゲノムが報告され、変異の全体像、リアレンジメント、コピー数変化の統合把握が可能なことが実証された。乳癌全ゲノム解析では数百のゲノム再配置が存在し、これまで不明だった変異プロセスの存在が示唆された。

ICGCと大規模シークエンシングの必要性: 特定のがん種でドライバー変異を体系的に同定するには、5%の頻度で変異する遺伝子を統計的に検出するため数百例規模の全ゲノムシークエンシングが必要である。ICGCは50以上のがん種でそれぞれ数百例(合計n = 20,000例以上)の全ゲノムシークエンシングを目標とする国際協調プロジェクトとして設立された。各がん細胞とペアになる正常細胞のゲノムシークエンシングも必要(体細胞変異と生殖細胞系列変異の識別のため)。1がんゲノムの完全な体細胞変異カタログ取得には20倍以上のカバレッジ = 100,000,000,000塩基対以上の配列データが必要と推算される。各がん種での体細胞変異の包括的カタログは、(a) 新たな薬剤標的の同定、(b) 予後予測バイオマーカーの発見、(c) 変異シグネチャーによる発がん要因の解明、(d) 治療選択・抵抗性予測、(e) 将来的な臨床での1,000ドルゲノムシークエンシングによる個別化医療を可能にするとされた。NGSの産出量はslab gel時代からmassively parallel sequencing時代にかけて100万倍以上(>1,000,000-fold)向上しており (Figure 3)、このlogスケールの技術的進歩がICGC計画の実現可能性を支えた。小細胞肺がん細胞株NCI-H2171の体細胞変異カタログでは、多様な種類の変異が数百から数千個含まれることが示された (Figure 2)。

考察/結論

本レビューは、がんゲノム研究が次世代シークエンシング(NGS)時代に突入した歴史的転換点において書かれた理論的基盤文献であり、3つの概念的貢献が際立つ。

新規性: 第一に、ドライバー変異とパッセンジャー変異の明確な定義と区別の枠組みは、その後の全ゲノムシークエンシング解析において変異優先順位付けの標準的概念となった。本論文執筆時点で同定されていたがん遺伝子は約350個(ゲノムタンパク質コード遺伝子全体の約1.6%)であったが、ICGCおよびTCGAの後続研究(n = 数千例)により現在では600以上に拡大し、多くの低頻度ドライバー遺伝子が発見された。本研究で初めて、がんゲノムにおける体細胞変異の包括的なカタログ化の重要性を提唱し、その実現可能性を技術的進歩と結びつけて示した点で新規性がある。

先行研究との違い: 第二に、がんのダーウィン進化的枠組みは、腫瘍内不均一性(ITH)、クローナル進化、治療抵抗性の理解を統一的に説明する理論として広く受け入れられ、液体生検、微小残存病変(MRD)モニタリング、適応療法の理論的根拠となった。これまでの研究が個々のがん遺伝子の発見に焦点を当てていたのと異なり、本レビューはがんをゲノム全体の進化プロセスとして捉える視点を提供した。

臨床応用: 第三に、変異シグネチャーの概念は後にICGC/TCGAデータによって体系化され(Alexandrov et al. 2013, Nature; n = 約10,000 cancer genomes)、現在では組織、曝露、DNA修復欠損を反映する60以上のSBS (single base substitution) シグネチャーが同定されている。本論文執筆後、ICGCおよびTCGAによる数千例規模のがんゲノム解析はここで提示された予測・展望の多くを実証した。変異数の多様性(>100,000個の点変異を持つがん vs. <1,000個のがん)はその後の腫瘍変異量(tumor mutational burden: TMB)と免疫チェックポイント阻害薬応答の関係研究に直結し、MSI-H/高TMBがんにおけるペムブロリズマブ適応(FDA承認2017年)の科学的基盤を提供した。変異シグネチャー研究では、タバコ煙関連のSBS4・SBS92 (single base substitution signature 92)、UV関連のSBS7a/7b、APOBEC関連のSBS2/SBS13など組織特異的シグネチャーが確定した。腫瘍変異量の中央値はがん種により数十〜数万個/Mbと大きく異なり、同一がん種内でも数100-fold以上のばらつきがある。がんゲノムシークエンシングの臨床実装は2020年代に現実となり、コンパニオン診断、腫瘍遺伝子パネル検査、ctDNA液体生検が日常診療に組み込まれつつある。本論文が提唱した「がんゲノムの完全カタログから個別化治療へ」というビジョンは着実に実現しつつあり、教科書的総説として現在も広く引用されている(引用数5,000回以上)。これらの知見は、新たな薬剤標的の同定、予後予測バイオマーカーの発見、発がん要因の解明、治療選択・抵抗性予測、そして最終的には個別化医療の実現という臨床応用に直結するものである。

残された課題: 今後の検討課題として、低頻度で変異するがん遺伝子の機能的検証、非コード領域におけるドライバー変異の同定、エピゲノム変化とゲノム変異の相互作用の解明、そして腫瘍微小環境におけるがん細胞進化の動態をより詳細に理解することが残されている。また、単一細胞レベルでのゲノム解析技術の発展により、腫瘍内不均一性の全貌を明らかにし、治療抵抗性クローンの早期検出と介入を可能にすることも今後の重要な方向性である。Limitationとしては、本レビュー執筆時点では次世代シークエンシング技術が黎明期にあり、多くの予測がまだ検証段階であった点が挙げられる。

方法

本論文はレビュー論文であり、がんゲノム研究における主要な概念、技術的進展、および将来の方向性を体系的に論じる。具体的には、以下の要素を詳細に検討する。(1) がんのダーウィン進化論的枠組み: 細胞集団における遺伝的変異の獲得と自然選択の原理に基づき、がん発生と進行のメカニズムを説明する。(2) 体細胞変異の分類と獲得機序: 塩基置換、挿入/欠失、再配置、コピー数変化といった多様な体細胞変異の構造的クラスを定義し、内因性および外因性変異原、DNA修復エラーによる変異の蓄積過程を解説する。また、ウイルス配列の組み込みやミトコンドリアゲノムの変異についても言及する。(3) ドライバー変異とパッセンジャー変異の概念的定義(Box 1): がん細胞に成長優位性を与えるドライバー変異と、がん発生に寄与しないパッセンジャー変異を明確に区別し、全ゲノムシークエンシングデータからドライバー変異を識別するための統計的比較、機能的解析、大規模サンプルによる再現性確認の必要性を論じる。(4) がん遺伝子レパートリーの系統的概観: これまでに同定された約350個のがん遺伝子の同定方法(細胞遺伝学的解析、生物学的アッセイ、PCRスクリーニング、遺伝性腫瘍の連鎖解析)と、その活動形式(優性または劣性)を分類する。特に、プロテインキナーゼの役割や、MAPK/ERK経路における変異の集中についても言及する。(5) がんゲノムシークエンシング研究の発展: コーディングエクソンスクリーニングから全ゲノムシークエンシングへの研究発展の歴史を概観し、BRAF、PIK3CA、EGFR、IDH1などの主要ながん遺伝子発見の経緯とその意義を説明する。また、急性骨髄性白血病や乳癌の全ゲノム解析の初期成果を提示する。(6) 国際がんゲノムコンソーシアム(ICGC)プロジェクトの必要条件と規模: 数百例規模の全ゲノムシークエンシングが必要とされる理由を統計的観点から説明し、ICGCが50以上のがん種でそれぞれ数百例(合計n = 20,000例以上)の全ゲノムシークエンシングを目標とすること、および正常細胞ゲノムとのペアシークエンシングの重要性を強調する。使用データは、COSMICデータベース、広範な文献レビュー、および著者らのWellcome Trust Sanger Instituteにおける研究実績に基づく。特に、次世代シークエンシング技術の急速な進歩(Figure 3)が、このような大規模プロジェクトの実現可能性を支えていることを示す。統計的手法としては、変異頻度の期待値との統計的比較や、大規模サンプルにおける再現性確認がドライバー変異同定に不可欠であると述べている。本レビューは、PubMed、Embase、Web of Scienceなどの主要な学術データベースを用いて、2009年までの関連文献を広範に検索し、がんゲノム、体細胞変異、次世代シークエンシング、がん遺伝子といったキーワードで包括的にレビューを実施した。文献の選択は、がんゲノム研究における主要な概念的進展、技術的ブレークスルー、および大規模プロジェクトの設立に関する報告に焦点を当てて行われた。