- 著者: Imielinski M, Berger AH, Hammerman PS, Hernandez B, Pugh TJ, Hodis E, Cho J, Suh J, Capelletti M, Sivachenko A, et al.
- Corresponding author: Meyerson M (Dana-Farber Cancer Institute / Broad Institute of Harvard and MIT)
- 雑誌: Cell
- 発行年: 2012
- Epub日: N/A
- Article種別: Original Article
- PMID: 22980975
背景
肺腺癌は非小細胞肺癌 (NSCLC) の最も一般的なサブタイプであり、世界で年間50万人以上の死亡を引き起こす。肺癌全体では年間130万人超が死亡し、そのうち40%以上が肺腺癌であり、5年生存率は約15%と依然として低い水準にある。分子標的治療の進展により、EGFR変異 (米国症例の約15%) やALK融合といった特定の分子異常が臨床的に標的とされ、標準化学療法と比較して優れた効果を示すことが臨床試験で示されている (Kwak et al. NEnglJMed 2010、Lynch et al. NEnglJMed 2004、Paez et al. Science 2004、Pao et al. ProcNatlAcadSciUSA 2004)。しかし、これらの既知のドライバー変異で説明できる症例は限られており、KRAS、BRAF、ERBB2、PIK3CA変異やRET、ROS1転座なども追加ドライバーとして知られているものの、依然として多くの症例で発がんドライバーが未解明であった。
一方、TP53、STK11、RB1、NF1、CDKN2A、SMARCA4、KEAP1などの腫瘍抑制遺伝子も肺腺癌で頻繁に不活性化されることが報告されているが、これらを治療標的として開発することは困難であった。2012年時点での先行研究は、16例程度の小規模コホートに留まり、新規ドライバー遺伝子を統計的に同定するのに十分な検出力を有していなかった。例えば、Liu et al. (2012) の16例の全エクソームシーケンス研究では、いくつかの変異遺伝子が列挙されたものの、正の選択を受けている遺伝子を特定するには至らなかった。また、Ding et al. (2008) やKan et al. (2010) の大規模な標的シーケンス研究では、既知のドライバー遺伝子やコピー数変化が特定されたが、網羅的なエクソーム・ゲノム解析による全体像の把握は不足していた。
本研究は、当時最大規模となる183例の肺腺癌コホートを構築し、全エクソームおよび全ゲノムシーケンスによる包括的ゲノム解析を実施した。これにより、肺腺癌の変異景観の全体像を把握し、統計的に有意な新規ドライバー遺伝子を同定すること、さらに変異シグネチャーと臨床的特徴との関連を明らかにすることが目的とされた。この大規模な解析は、従来の小規模研究では検出が困難であった低頻度変異や、高変異率腫瘍における統計的偽陽性の問題を克服するための新たな解析手法の適用を可能にし、肺腺癌の分子病態理解における知識ギャップを埋めることを目指した。
目的
本研究の目的は、183例の肺腺癌患者の腫瘍および対応する正常組織の全エクソームおよび全ゲノムシーケンスデータを体系的に解析することである。具体的には、以下の点を明らかにすることを目指した。
- 肺腺癌における体細胞変異の全体的な景観と、エクソン内の平均変異率を評価すること。
- 正の選択を受けている新規体細胞変異遺伝子を統計的に同定すること。特に、高変異率腫瘍における統計的偽陽性の問題を克服するため、InVExアルゴリズムを適用し、既知のドライバー遺伝子に加え、新たなドライバー候補を特定すること。
- ヌクレオチド文脈特異的変異シグネチャーを解析し、喫煙歴や病期などの臨床的特徴との相関を明らかにすること。
- 全ゲノムシーケンスデータを用いて、肺腺癌における構造変異の頻度とタイプを網羅的に同定し、特にフレーム維持型エクソン内変異に注目して、EGFRやSIK2 (salt-inducible kinase 2) などのキナーゼにおける新規の構造再編成を特定すること。
- 同定された新規ドライバー遺伝子 (例: U2AF1) の臨床的意義、特に無増悪生存期間 (PFS) との関連を評価すること。
これらの目的を達成することで、肺腺癌の発がんメカニズムに関する理解を深め、将来的な診断マーカーや治療標的の開発に貢献することを目指した。
結果
変異率と喫煙関連変異シグネチャー: 183例の肺腺癌エクソーム解析により、エクソンの中央変異率は8.1 mutations/Mb、平均12.0 mutations/Mb (範囲: 0.04-117.4) であった。これは黒色腫や肺扁平上皮癌を除く他の上皮性腫瘍と比較して高い水準である。喫煙者の変異率中央値9.8/Mbは非喫煙者の1.7/Mbと比較して有意に高く (p = 3.0 × 10⁻⁹、Wilcoxon rank sum test)、喫煙による顕著なDNA損傷蓄積が確認された。 182例のWESデータを用いた階層的クラスタリングにより、5種類の変異スペクトルクラスターが同定された。Cluster 1はCpG→T変異が優位で全体的に低変異率であり、非喫煙者および軽喫煙者に有意に富化していた (p = 1.9 × 10⁻⁹、Fisher’s exact test)。Cluster 3はCpGコンテキスト外のC→Aトランスバージョンが追加され、KRASドライバー変異と有意に関連した (p = 0.00071)。Cluster 4は進行期 (IIIBまたはIV期) の患者に有意に富化していた (p = 0.0063、Fisher’s exact test)。CpG→TとC→Aの比を用いた喫煙状況の分子推定は、既知の喫煙状況を持つ患者の75%以上で正確に再現された (Figure 1B)。
有意変異遺伝子の同定: PPH2 (PolyPhen-2) InVEx、LOF InVEx、CGC限定PPH2、CGC限定LOFの合計4つの解析アルゴリズムの和集合として、25遺伝子が統計的に有意な変異遺伝子 (q < 0.25) として同定された (Figure 2A)。既知のドライバー遺伝子として、TP53 (50%)、KRAS (27%)、EGFR (17%)、STK11 (15%)、KEAP1 (12%)、NF1 (11%)、BRAF (8%)、SMAD4 (3%) が確認された。この解析では、12,907の変異遺伝子が評価され、最小限の統計的インフレーションで有意な遺伝子が特定された (Figure S2D)。
新規ドライバー遺伝子U2AF1、RBM10、ARID1Aの同定: 新規ドライバー遺伝子として、以下の3つが同定された。
- スプライシング因子U2AF1: 3%の症例に再発性c.101C>T/p.S34F変異が認められ、PPH2 InVEx解析で有意であった (p = 2.0 × 10⁻⁶)。このS34F変異は骨髄異形成症候群 (MDS) で既報の変異と全く同一であり、上皮性腫瘍での報告は本研究が初めてである (Figure 3A)。U2AF1変異はNF1変異と有意に共存し (p = 0.0011)、U2AF1変異を有する4例の患者では無増悪生存期間 (PFS) が有意に短縮した (p = 0.00011、log rank test) (Figure S3E)。
- RNA結合タンパク質RBM10: 12/183例 (7%) で変異が認められ、ナンセンス、フレームシフト、スプライス部位変異といったtruncating変異が7/12例に富化していた (Figure 3B)。これはPPH2 InVEx解析で有意であった (p = 0.00042)。RBM10変異はKRAS、EGFR、PIK3CA変異を有する症例に共存し、独立したドライバーとしての役割を示唆した。
- クロマチンリモデリング因子ARID1A: 8%の症例で変異が認められ、LOF変異 (ナンセンス置換、フレームシフトindel) が有意に蓄積していた (p = 0.027、CGC LOF InVEx) (Figure 3C)。
コピー数変化と癌ホールマーク: 頻繁なゲインとして、TERT (42%の症例、15%が焦点増幅)、MYC (31%)、EGFR (22%)、NKX2-1 (18%、10%が焦点増幅) が観察された。頻繁なロスとして、CDKN2A (24%、10%がホモ欠失)、TP53 (18%)、SMAD4、KEAP1、SMARCA4が認められた。25の既知肺腺癌遺伝子を癌ホールマーク (Hanahan et al. Cell 2011) にマッピングしたところ、全コホートの6%のみが6つの古典的ホールマーク全てに遺伝子異常を有し、「増殖シグナルの維持」ホールマークを説明できる既知ドライバー変異は47%の症例にしか存在しなかった (Figure 6)。約15%の患者では、単一のホールマーク関連遺伝子変異も検出されなかった。
構造変異とEGFRインフレーム欠失: WGSが実施された24例において、2,349件の体細胞構造変異が同定された。そのうち71件 (3%) はフレーム維持エクソン内変異であった。新規発見として、EGFRエクソン25-26を欠失するインフレーム欠失 (EGFRvIVb相当) がWGSで同定された (Figure 5A)。この変異はNIH 3T3細胞 (n=3 replicates) への強制発現により、ソフトアガー上でのコロニー形成 (Figure 5B)、EGFRおよびAKTのリガンド非依存的リン酸化亢進 (Figure 5C)、Ba/F3細胞 (n=6 replicates) のIL-3非依存的増殖 (erlotinib感受性) を実証し、その腫瘍原性が確認された (Figure 5D)。この欠失変異体は、野生型EGFRと比較して、erlotinibに対するIC50値が約10 nMと低く、高い感受性を示した。また、SIK2 (salt-inducible kinase 2) のキナーゼドメイン重複 (Thr-175上流15アミノ酸) およびROCK1の19エクソン重複も同定された (Figure 4B)。EGFR変異はKRAS変異と強く排他的であり (p = 3.3 × 10⁻⁴)、非喫煙者に富化していた (p = 2.0 × 10⁻⁶)。TP53変異もPFS短縮と相関した (p = 0.0014)。
考察/結論
本研究は、2012年時点で最大規模の183例の肺腺癌ゲノム解析であり、肺腺癌の遺伝的景観の包括的な理解に多大な貢献をなした。
先行研究との違い: 本研究は、従来の小規模コホート研究や標的シーケンス研究とは異なり、全エクソームおよび全ゲノムシーケンスを大規模コホートに適用し、高変異率腫瘍における統計的偽陽性の問題を克服するInVExアルゴリズムを用いることで、より信頼性の高いドライバー遺伝子同定を実現した。従来の二項分布モデルでは1,300以上の遺伝子が有意とされたのに対し、InVExは25遺伝子に絞り込み、実質的なシグナル/ノイズ比の改善を達成した。これにより、既知のドライバー遺伝子を再確認しつつ、これまで報告されていない新規ドライバー遺伝子を特定することが可能となった。
新規性: 本研究で初めて、スプライシング因子U2AF1とRNA結合タンパク質RBM10が肺腺癌の発がんドライバーとして機能することを統計的に示した。特にU2AF1のS34F変異は、骨髄異形成症候群 (MDS) で既報の変異と同一であり、上皮性腫瘍におけるスプライシング因子変異の重要性を初めて明らかにした点で新規性が高い。また、クロマチンリモデリング複合体構成要素であるARID1Aの機能喪失変異も新規ドライバーとして同定された。これらの発見は、スプライシング制御機構やエピゲノム制御機構が肺腺癌の発がんにおいて重要な役割を果たすことを示唆している。さらに、EGFRエクソン25-26欠失という新規のインフレーム構造変異を同定し、その腫瘍原性とerlotinib感受性を実験的に実証した点も新規の知見である。
臨床応用: 本研究の成果は、肺腺癌の診断と治療に複数の臨床的含意を持つ。U2AF1変異が有意なPFS短縮と関連することが示され (p = 0.00011)、予後予測マーカーとしての可能性が示唆された。EGFRインフレーム構造変異はerlotinib感受性を持つことが実証され、既存のEGFR-TKIに対する新たな適応患者群を特定する可能性を示した。また、変異シグネチャー解析による喫煙状況の分子推定 (75%以上の精度) は、臨床情報が不完全な症例の分子分類や、喫煙関連発がんリスクの評価への応用可能性を示唆する。スプライシング因子やエピゲノム調節因子の変異は、これらを標的とした新規治療薬開発の可能性を開くものである。
残された課題: 今後の検討課題として、本研究で同定されたU2AF1、RBM10、ARID1Aなどの新規ドライバー遺伝子の詳細な機能的検証と、これらを標的としたスプライシング阻害薬やエピゲノム調節薬などの開発が挙げられる。また、本コホートの約15%が単一の増殖シグナル維持ホールマーク遺伝子変異を持たず、約半数の症例で既知のドライバー変異が見つからなかったことは、肺腺癌ドライバーの全容解明には更なる大規模解析 (例: The Cancer Genome Atlas (TCGA) など) や、RNAシーケンス、メチル化プロファイリングなどのオミクスデータ統合解析が必要であることを示している。本研究は後続のTCGA肺腺癌解析 (2014年) の基礎となり、スプライシング因子変異の癌治療における重要性認識に大きく貢献した。
方法
本研究では、183例の肺腺癌腫瘍組織と対応する正常組織ペアから抽出したDNAを対象に、次世代シーケンシングを実施した。コホートの内訳は、全エクソームシーケンシング (WES) が159例、全ゲノムシーケンシング (WGS) が24例 (うち23例はWESも実施) であった。WESは標的領域36.6 Mbに対し、腫瘍DNAで中央カバレッジ92倍 (範囲: 51-201)、正常DNAで92倍 (範囲: 62-141) で実施された。WGSは腫瘍DNAで中央カバレッジ69倍 (範囲: 25-103)、正常DNAで36倍 (範囲: 28-55) で実施され、ストローマ細胞混入を考慮し腫瘍カバレッジを高く設定した。全症例でSNPアレイ解析も実施し、ゲノムワイドな体細胞コピー数変化を検出した。
患者コホートの臨床的特徴は、喫煙状況として非喫煙者27例、軽喫煙者 (10パック年未満) 17例、重喫煙者 (10パック年超) 118例、不明21例が含まれた。病期はI期90例、II期36例、III期22例、IV期10例、不明25例であった。全ての腫瘍は化学療法未施行の原発切除検体であった。
体細胞変異の同定には、MuTectを中心とした腫瘍-正常ペア比較アルゴリズムが使用された。このアルゴリズムはストローマ細胞混入のある癌組織に特化して調整されている。同定された変異のうち、ランダムに選択された69件の候補変異について超深度 (1,000倍超) 標的再シーケンスによるバリデーションを実施し、挿入欠失 (indel) 変異の91% (30/33) と置換変異の92% (33/36) が体細胞変異として確認された。
統計的ドライバー遺伝子同定には、高変異率腫瘍に特有の統計的インフレーション問題を解決するために開発されたInVEx (Integrated Variant Excursion) アルゴリズム (Hodis et al., 2012) を適用した。InVExは、エクソン内、UTR、イントロンの変異を遺伝子内でランダム置換することで、遺伝子特異的な中立変異率のnull分布を生成し、機能的影響の有無を評価する。解析は、PolyPhen-2 (PPH2) スコアに基づく機能的影響評価と、機能喪失 (LOF) 変異 (ナンセンス、フレームシフト、スプライス部位変異) に限定した評価の2種類で実施された。さらに、Cancer Gene Census (CGC) 遺伝子に限定した補完解析も行った。
変異シグネチャー解析は、182例のWESデータを用いて、トリヌクレオチドコンテキスト別変異率の非偏階層的クラスタリングにより実施された。これにより、異なる変異スペクトルクラスターが同定され、臨床的特徴との関連が評価された。
WGSが実施された24例については、paired-endおよびsplit-readマッピングを用いて、2,349件の体細胞構造変異のブレークポイントを検出・マッピングした。特に、フレーム維持型エクソン内変異 (71件、全体の3%) に着目し、キナーゼ遺伝子における新規の構造再編成を探索した。同定されたEGFRの新規インフレーム欠失変異については、NIH 3T3細胞への強制発現実験により、ソフトアガー上でのコロニー形成能、EGFRおよびAKTのリン酸化亢進、Ba/F3細胞のIL-3非依存的増殖 (erlotinib感受性) を評価し、その腫瘍原性を検証した。この実験では、野生型EGFRを発現するNIH 3T3細胞と比較して、EGFRエクソン25-26欠失変異体を発現する細胞は、EGF非存在下で約5倍のコロニー形成能を示した。