- 著者: Cheng Wang, Rong Yin, Juncheng Dai, Yayun Gu, Shaohua Cui, Hongxia Ma, et al.
- Corresponding author: Hongbing Shen (Nanjing Medical University); Lin Xu (Jiangsu Cancer Hospital); Liyan Jiang (Shanghai Chest Hospital); Zhibin Hu (Nanjing Medical University)
- 雑誌: Nature Communications
- 発行年: 2018
- Epub日: N/A
- Article種別: Original Article
- PMID: 29799009
背景
中国の肺癌患者は欧米患者と異なるユニークな疫学的特徴を持ち、特に女性の肺癌罹患率が喫煙率の極めて低い中国で高いことが知られていた。また、中国人 NSCLC では EGFR 変異率が高く (PIONEER 試験 (Shi et al. JThoracOncol 2014) で約 50% vs TCGA の 13.6%) KRAS 変異率が低いという逆転したパターンが観察されており、喫煙以外の発がんメカニズムの存在が示唆されてきた。一方で TCGA や Campbell et al. (Campbell et al. NatGenet 2016) が欧米コホートで体系的に明らかにしたゲノムランドスケープと中国人コホートの分子的同等性は未解明であった。
全ゲノムシーケンシング (WGS; whole-genome sequencing) は全変異シグネチャーを網羅的に同定し、腫瘍の発がん機序の解明に有用な手段である。Alexandrov et al. (Alexandrov et al. Nature 2013) が発がんプロセスを変異シグネチャーへ分解する非負値行列因子分解 (NMF; non-negative matrix factorization) 法を確立したが、中国人 NSCLC 患者を対象とした大規模 WGS 解析はこれまでに限られていた。腫瘍促進性炎症は Hanahan & Weinberg の Cancer Hallmarks の一つとして認識されているが、特定のゲノムシグネチャーと炎症性微小環境を結びつけた研究は存在せず、「炎症がどのゲノム的痕跡を残すか」という分子レベルでの理解は手薄であった。具体的には、(1) 中国人特有 EGFR 集積を説明する変異シグネチャー、(2) シグネチャーと腫瘍浸潤リンパ球 (TIL; tumor-infiltrating lymphocyte) の対応、(3) 非喫煙 NSCLC における構造的再配列の役割、の 3 点が研究のギャップとして残されていた。
目的
中国人 NSCLC 患者の WGS により包括的なゲノムランドスケープを特定し、変異シグネチャー (mutational signature; MS) と炎症性 TIL の関連を解明すること。特に EGFR 変異の高頻度集積に関する新たなメカニズム (炎症性微小環境による誘導仮説) を提示し、構造的再配列シグネチャー (RS; rearrangement signature) との関係を解析する。
結果
腺癌・扁平上皮癌間で二極化した変異負荷と中国人特異的パターン:中国人腺癌の変異負荷 (中央値 2.17 mutation/Mb) は扁平上皮癌 (中央値 13.64 mutation/Mb) と顕著に差があり (Wilcoxon P = 3.45 × 10⁻⁸)、欧米コホート (それぞれ 8.7 vs 9.7 mutation/Mb、Campbell et al. 2016) とは大きく異なるパターンを示した (Fig 1a)。構造的再配列は中央値 126 個 (範囲 16-405) と豊富であったが、組織型・喫煙状況間に有意差はなかった。
EGFR 高頻度集積と TKI 感受性変異の蓄積:27 個の SMG が同定され、うち 15 個が既知ドライバーであった (Fig 1b)。EGFR 変異率は中国人腺癌で 52.0% と TCGA の 13.6% を有意に上回り (Fisher P = 6.69 × 10⁻¹⁴、Fig 1c)、TKI 感受性変異 (19 番エクソン欠失 20 例・L858R 19 例) の集積が確認された。EGFR 増幅も 18.8% に認められ、うち 10.7% が EGFR 変異と共起した。EGFR は扁平上皮癌でも 4.6% (TCGA 3.4%) と検出された。一方で KRAS 変異は 8.0% (TCGA 31.3%) と低頻度で、EGFR 変異と排他的であった。STK11 変異も腺癌で低頻度であり、RB1 変異は腺癌 15.5% (TCGA 5.4%) と高く TP53 変異と共起した。扁平上皮癌特異的ドライバーは TP53 (75%)・KMT2D (28%)・CDKN2A (22%)・FBXW7 (9%) など古典的腫瘍抑制因子が中心で、NFE2L2 変異は扁平上皮癌のみに有意に高頻度であった。
3 つの変異シグネチャー MS1-MS3 とその中国人 NSCLC 全体への分布:NMF 解析で 3 つの MS を抽出した (Fig 1d, Supplementary Fig 3a)。MS1 は APOBEC 関連 (TpC コンテキスト C>T) で腺癌の 10.9% に認められた。MS2 は喫煙関連 (C>A 優位) で扁平上皮癌全例に認められ、TCGA 扁平上皮癌でも同程度であった。MS3 は 96 塩基置換タイプに分散し C>T / T>C 優位という独特の特徴を持ち、機序が未解明な「鏡的な」シグネチャーであった。MS3 は腺癌 (P = 5.77 × 10⁻⁵)・非喫煙者 (P = 3.76 × 10⁻⁶)・女性患者 (P = 4.09 × 10⁻³) で有意に高頻度であった。中国人患者の 33.7% (31/92 例) が MS3 dominant と分類され、TCGA (14.6%) の 2 倍以上 (OR = 2.30, Fisher P = 0.01) であり、中国人 NSCLC に特異的な集積パターンが示された。
MS3 と腫瘍浸潤リンパ球 (TIL) の有意な正相関:GSEA 解析で MS3 と正相関する遺伝子群は KEGG 165 パスウェイ中 14 の免疫応答関連経路 (glycan biosynthesis・lysosome・intestinal immune network for IgA production 等) に有意に濃縮された (FDR q < 0.05、Fig 4a)。TIMER による in silico TIL 推定では MS3 割合と B cell・CD4+T cell が有意に正相関し (B cells FDR q < 0.05、Fig 4b)、IHC (CD19・CD4) でも MS3 dominant 患者群で B 細胞・CD4+T 細胞の有意な高密度を確認した (Fig 4c, 4d)。組織型による交絡を partial correlation で調整しても B cells × MS3 の相関は有意であった (Spearman partial r = 0.21, P = 0.047)。TCGA データでも EGFR 変異患者は KRAS 変異患者より B 細胞が有意に豊富であり (Wilcoxon P = 0.007、Fig 4f)、炎症性微小環境と EGFR 変異の関連が独立コホートで再現された。さらに MS3 と相関する遺伝子群は Treg・Th2・Th17 特異的遺伝子セット (P_Treg = 0.004・P_Th2 = 0.004・P_Th17 = 0.008) に濃縮されたが Th1 ではなかった (P_Th1 = 0.43、Fig 4e)、慢性炎症型 T cell 亜集団との関連を示した。
MS3 と EGFR 変異率の強い量依存的関連 (最大 80%):EGFR 変異は MS3 dominant 患者に有意に集積し (Cochran-Armitage trend test P = 9.37 × 10⁻⁵、Fig 2b)、MS3 割合を 8 群に分けると 7-8 群で EGFR 変異率が最大 80% に達した (Fig 2c)。これに対し TCGA では同等の MS3 高値群が少なく、EGFR 変異率の集団間差を説明した。AAH (atypical adenomatous hyperplasia) の再解析 (Sivakumar et al. CancerRes 2017) で炎症性微小環境が EGFR 変異形成よりも前駆病変段階で先行することも示され、炎症 → EGFR 変異という時間的順序を裏付けた (Supplementary Fig 10)。
MS3 と長距離 (>1 Mb) 構造的再配列の共起と RTK 融合の生成:3 つの構造的再配列シグネチャー (RS1-RS3) が NMF 解析で抽出された (Fig 3a)。RS1/RS2 は >1 Mb 長距離再配列に特徴付けられ、全 intra-chromosomal rearrangement の 60% 以上を占めた。MS3 割合と RS1/RS2 割合は有意に正相関した (Spearman r = 0.53, P = 1.35 × 10⁻⁷、Fig 3b)。MS3 最高四分位患者の 50% が ALK・ROS1・RET 融合のいずれかを保有 (Fisher OR = 10.43, P = 0.02、Fig 2c) し、TCGA でも同様 (OR = 30.41, P = 0.004) で再現性が示された。新規 CD63-BCAR4 融合 (ERBB family-related lncRNA) も MS3 最高値群で同定された (Supplementary Fig 5)。一方で RS3 は <1 Mb 短距離再配列で MS2 (喫煙) と相関し (Spearman r = 0.52, P = 2.22 × 10⁻⁷)、DDR (DNA damage response) 経路変異と関連した。PD-L1 (CD274) 発現は MS2 (Spearman r = 0.16, P = 0.04) および総変異負荷 (r = 0.16, P = 0.03) と正相関し、喫煙関連 NSCLC で免疫チェックポイント阻害薬への感受性が高いという臨床的観察と整合した (Rizvi et al. Science 2015)。
考察/結論
本研究は中国人 NSCLC 149 例に対する初の大規模 WGS で、MS3 という独特の C>T/T>C 優位な変異シグネチャーが腫瘍浸潤性 B リンパ球と CD4+T (Treg/Th2/Th17) と強く関連すること、MS3 が EGFR 変異率の量依存的増加 (最大 80%) を駆動すること、MS3 が長距離 (>1 Mb) 構造的再配列と共起し ALK・RET 融合を生成することを示した。先行研究との違い:欧米中心の TCGA や Campbell et al. NatGenet 2016 (Campbell et al. NatGenet 2016) は喫煙関連変異が主体の患者群を解析しており、中国人腺癌特有の低変異負荷 (2.17 vs 8.7 mut/Mb) と高 EGFR 変異率 (52% vs 13.6%) という対照的な分子相違を統合的に説明する枠組みは欠如していた。本研究はそれと異なり、炎症性 TIL 浸潤 → MS3 シグネチャー → EGFR 変異・RTK 融合という発がん経路の連鎖を明示した点で対照的な貢献である。
新規性: 本研究で初めて「炎症性ゲノムシグネチャー」という概念が NSCLC で確立され、これまで報告されていない量依存的 MS3 → EGFR 変異率上昇 (最大 80%) の関係が定量化された。Lavin et al. Cell 2017 や Shiels et al. Carcinogenesis 2017 が示した早期肺癌の炎症性免疫景観や非喫煙者 NSCLC リスクと血中炎症マーカーの関連と組み合わせ、炎症 → EGFR 変異 → 腺癌という新規発がんモデルを提唱した。Fedeles et al. PNAS 2015 が示した chronic inflammation-induced 5-chlorocytosine 形成による MS3-like C>T/T>C 変異という分子機序が本研究結果と整合する。
臨床応用: EGFR 変異患者では TKI 単独治療が標準であるが、本研究の知見は 臨床応用 上以下を示唆する: (1) 炎症性微小環境の存在を分子サブタイピングで定義できれば、TKI と免疫療法の組み合わせが特に MS3 dominant + EGFR 変異 + TKI 耐性患者で有効となる可能性、(2) 腺癌前駆病変 AAH で MS3 が形成されることから、bench-to-bedside の橋渡し として early intervention (NSAIDs 等抗炎症療法) による化学予防への道が開ける可能性、(3) MS3 最高四分位群の ALK・RET 融合スクリーニング強化、(4) 喫煙関連 MS2 dominant NSCLC への ICI 適応の妥当性 (TCGA TMB-immunotherapy 軸 (Rizvi et al. Science 2015) と整合)。
残された課題: 本研究の limitation と 今後の検討 課題: (1) 炎症 → EGFR 変異の因果関係を確立する縦断的 / 動物モデル研究の不在、(2) どの分子機序 (5-chlorocytosine / 酸化ストレス / AID-induced deamination) が MS3 を実際に生成するかの細胞内検証、(3) 今後の研究 として、EGFR 変異腺癌に対する TKI + anti-PD-1 / anti-PD-L1 併用の前向き試験 (CheckMate 722 / TATTON / TKI+ICI コホート) との分子相関解析、(4) 抗炎症療法 (低用量 aspirin / IL-6 阻害薬) の化学予防効果検証、(5) MS3 を効率的に検出する panel-seq 簡易版の開発、(6) BRCA2-like 再配列を持つ喫煙関連 NSCLC への PARP 阻害薬感受性試験 (BRCA1/2 変異が稀ながら RS3 が DDR 障害を示唆)、が挙げられる。
方法
コホート: Nanjing Lung Cancer Cohort (NJLCC) から 92 例の NSCLC 腫瘍-血液ペア (腺癌 57 例・扁平上皮癌 35 例) に WGS を実施し、さらに 57 例 (腺癌 27・扁平上皮癌 30) に WES を実施した (合計 n=149)。TCGA WGS データ 100 例を外部検証コホートとして用いた。NJLCC コホートの喫煙率は 53.7% で TCGA (85.5%) より低く、特に腺癌で 34.5% (TCGA 82.4%) と顕著であった。
シーケンシング: 150 bp paired-end WGS は腫瘍 67.84× / 血液 36.70× の平均カバレッジ、WES は 100 bp で腫瘍 112.50× / 血液 111.80× を達成。BWA-MEM v0.7.15 で GRCh37 にアラインメントし、Picard で重複除去、GATK v3.5 で再アラインメント・再キャリブレーションを実施。
体細胞変異 / SV 解析: 体細胞 SNV/indel は GATK Mutect2 で検出。Panel of normal (n=92) でフィルタ。構造変異 (SV; structural variant) は novoBreak v1.1.3rc、CNA は BIC-Seq2 で解析した。
ドライバー同定: IntOGen フレームワーク (OncodriveCLUST + OncodriveFM) と MutSigCV (v1.4) を組み合わせ、Benjamini-Hochberg FDR q<0.05 を有意変異遺伝子 (SMG; significantly mutated gene) 基準とした。
変異シグネチャー解析: 96 塩基置換コンテキストから NMF (SomaticSignatures Bioconductor パッケージ) で MS を抽出し、cosine 類似度で COSMIC シグネチャーと照合。寄与率 >0.5 を「dominant」と定義した。
構造的再配列シグネチャー (RS): 15 サイズ階級分類の rearrangement matrix を NMF で分解し、Piecewise Constant Fitting (PCF) で hotspot を同定した。
TIL 推定 / IHC 検証: RNA-seq から TIMER アルゴリズムで B cell・CD4+T・CD8+T・好中球・マクロファージ・樹状細胞を in silico 推定。MS3 dominant 12 例 vs その他 12 例で IHC (CD19 1:300・CD4 1:100) を実施し検証した。
統計解析: Wilcoxon rank-sum test、Spearman rank correlation、Fisher’s exact test、Cochran-Armitage trend test、GSEA (KEGG 165 pathway) を用い、Benjamini-Hochberg で多重検定補正を行った。