- 著者: Tongwu Zhang, Philippe Joubert, Naser Ansari-Pour, et al.
- Corresponding author: Maria Teresa Landi (National Cancer Institute, Bethesda, MD)
- 雑誌: Nature Genetics
- 発行年: 2021
- Epub日: 2021-09-06
- Article種別: Original Article
- PMID: 34493867
背景
非喫煙者肺癌 (LCINS) は、全肺癌の10-25%を占める主要な疾患であり、特に肺腺癌 (LUAD) として発症することが多い。喫煙関連肺癌とは分子的・臨床的特性が根本的に異なり、EGFR変異、ALK融合、ROS1融合など特定のドライバー遺伝子変異が高頻度で認められることが知られている。しかし、これまでの研究は主に喫煙者を対象とした全エクソームシーケンス (WES) に依拠しており、非喫煙者LUADに特化した全ゲノムシーケンス (WGS) コホートは、過去最大でも100例未満に留まっていた。特に、コピー数変化 (SCNA) の全体パターン、変異シグネチャー、および進化的軌跡を統合して非喫煙者肺癌を系統的に分類した研究はこれまで報告されておらず、この分野には大きな知識ギャップが残されていた。また、受動喫煙 (secondhand smoke) がゲノムに与える影響についても、その詳細なメカニズムは未解明であった。これらの背景から、非喫煙者肺癌の包括的なゲノム特性と進化的経路を解明し、より個別化された治療戦略を開発するための基盤を確立することが喫緊の課題であった。例えば、Cancer et al. Nature 2014やImielinski et al. Cell 2012などの先行研究は、喫煙者肺癌のゲノムランドスケープを詳細に解析してきたが、非喫煙者肺癌に特化した大規模なWGS解析は不足していた。本研究は、この未開拓の領域に焦点を当て、非喫煙者肺癌のゲノム多様性を包括的に理解することを目的とした。本研究は、非喫煙者肺癌におけるゲノム多様性の包括的な理解を深め、その病態生理を解明し、個別化された治療戦略の開発に貢献することを目指す。これまでの研究では、非喫煙者肺癌のゲノムランドスケープに関する大規模なWGSデータが不足しており、特にコピー数異常 (SCNA) に基づく包括的な分類は未確立であった。この知識のギャップを埋めることが本研究の主要な動機である。
目的
SherlockLung研究の一環として、232例の治療歴のない非喫煙者肺癌患者に対して高カバレッジ全ゲノムシーケンス (WGS) を実施し、ゲノムワイドな体細胞コピー数変化 (SCNA)、変異シグネチャー、ドライバー遺伝子、および進化的軌跡の統合解析を行う。これにより、生物学的・臨床的に意義のあるゲノム分類体系を確立し、非喫煙者肺癌の病態生理を深く理解するとともに、個別化された治療戦略の開発に貢献することを目的とする。特に、コピー数異常に基づいたサブタイプ分類を確立し、それぞれのサブタイプが持つ独自のゲノム特性、発症メカニズム、および臨床的意義を明らかにすることを目指した。また、受動喫煙がゲノムに与える影響についても詳細に解析し、その役割を評価することも目的の一つである。本研究は、非喫煙者肺癌 (LCINS) におけるゲノムの多様性を深く理解し、その進化的経路を解明することで、より効果的な診断および治療法の開発に貢献することを目指す。具体的には、非喫煙者肺癌のゲノムワイドな体細胞コピー数変化 (SCNA)、変異シグネチャー、ドライバー遺伝子、および進化的軌跡を統合的に解析し、生物学的および臨床的に意義のあるゲノム分類体系を確立することを主要な目的とする。
結果
コホートの基本ゲノム特性とドライバー遺伝子変異: 本研究の非喫煙者肺癌コホートにおける腫瘍変異量 (TMB) の中央値は1.1 Mut Mb⁻¹ (SNV 1.0 + indel 0.06) であり、これは喫煙者LUADのTMBと比較して7倍超低値であった (p = 7×10⁻⁷³)。RTK-Rasパスウェイ遺伝子のいずれかが全腫瘍の54.3%で変異を認め、最も頻度が高かったのはEGFR (30.6%)、次いでKRAS (7.3%)、ALK融合 (6.0%)、MET (4.3%)、ERBB2 (3.9%、全例indel)、ROS1 (2.6%)、RET (1.3%) の順であった。これら7遺伝子間の変異は強い相互排他性を示した (Extended Data Fig. 1a)。TP53欠損またはMDM2増幅は全体の25.4%に認められ、これらの腫瘍はSNV、SCNA、SV、kataegis、WGD、HLA LOHを高頻度に伴うことが示された (Extended Data Fig. 2b)。SVホットスポット領域はMDM2、TERT、6p21、MYC、CDKN2A、NKX2-1、GNAS周辺に集中し、全SVの16.7%を占めた (Extended Data Fig. 3)。既知のドライバー融合遺伝子は24例 (10.3%) に同定され、EGFR変異と相互排他的であった (p = 1.1×10⁻⁴)。
コピー数異常に基づく3つのサブタイプ (Piano, Mezzo-forte, Forte) の確立: 染色体腕レベルのSCNA非教師なしクラスタリングにより、コピー数変化の程度で明確に区別される3つのサブタイプが同定された (Fig. 3a)。
- Piano (全体の49.6%): SCNAがほとんどなく、ゲノムが安定している。36例中33例のカルチノイドと78例の腺癌を含む。TMBが著しく低く、中央値0.7 Mut Mb⁻¹ (カルチノイドはさらに低く0.4 Mut Mb⁻¹)。WGDは8.7%のみ。kataegis頻度29.6%。テロメア長は対応正常組織より長い (T/N:TL比平均1.1、p = 4.7×10⁻³)。KRAS変異を保有する腫瘍の76.5%がpianoサブタイプに属した (p = 0.02)。SETD2 (8例中8例がpianoに集中)、NKX2-1変異もpiano特異的であった。新規ドライバー遺伝子UBA1変異9例中6例がpianoに存在した。サブクローナル変異率が高く、腫瘍内不均一性が顕著であった (Fig. 3b)。
- Mezzo-forte (全体の30.2%): 中等度のSCNAを特徴とする。1q、5p、7p、7q、8qの染色体腕レベル増幅が特徴的であった (各p < 0.001)。EGFR変異率51.4%と高く、KRAS変異は1.4%のみであった。TMB中央値1.6 Mut Mb⁻¹。WGD 41.4%。kataegis頻度68.1%。
- Forte (全体の20.2%): 全ゲノム重複 (WGD) が支配的 (95.7%)。TP53変異が最高頻度 (31.9%) で認められた。TMB中央値1.4 Mut Mb⁻¹。SV中央値73個/腫瘍 (pianoの10個と対比)。テロメア短縮 (T/N:TL比平均0.9、p = 0.01)。喫煙者LUAD 38例のうち52.6%がforteに分類され、喫煙関連LUADとの類似性を示した (p = 6.6×10⁻⁵)。
変異シグネチャーと受動喫煙の影響: 計14種のSBSシグネチャーが同定された (Fig. 4)。酸化ストレス関連SBS18は全体の46%に認められ、forteとmezzo-forteで顕著に多かった (それぞれ59.6%、67.1%; p = 2.2×10⁻⁹ vs piano)。SBS8 (ヌクレオチド除去修復欠損/後期複製エラー) は13%に認められ、カルチノイドで30.3%と高頻度であった。全サンプルで内因性変異プロセス (SBS1/SBS5など) が外因性より優勢であり、コサイン類似度の中央値は0.96 vs 0.82 (p = 4.8×10⁻⁵³) であった (Extended Data Fig. 6)。APOBECシグネチャー (SBS2/SBS13) は58%の腫瘍 (>100 SNV) でサブクローナルに認められた。受動喫煙歴あり62例 (27.6%) においても喫煙直接関連シグネチャーSBS4は検出されなかった。シミュレーション解析により、SBS4が存在しても検出できる感度閾値は15%であり、受動喫煙による変異は15%未満に留まることが示唆された (Fig. 5)。このシミュレーションは、n=62 passive smokersのデータを用いて実施された。
新規ドライバー遺伝子UBA1の同定と進化的軌跡: IntOGenパイプラインにより25の反復変異遺伝子が同定された。このうち24遺伝子はTCGA Pan-Cancerで既知のドライバーであったが、UBA1 (ユビキチン活性化酵素1をコードするE1酵素) が新規ドライバー候補として同定された (9例中6例がpianoサブタイプ)。UBA1はDNA損傷応答の主要な調節因子である。ドライバー変異TP53、RBM10、KRAS、EGFRは3サブタイプ共通して早期 (WGDおよびSCNA出現前) に生じた。pianoサブタイプでは中央値で約9.10年の長い潜伏期 (MRCA出現から臨床診断まで) を示し、forteの0.08年、mezzo-forteの0.28年と比較して有意に長かった (p = 8.3×10⁻⁴) (Fig. 7b)。MRCA出現年齢の中央値はpiano 60.4歳、forte 63歳であった。
生存アウトカムとの関連: TP53変異またはMDM2増幅は予後不良と関連した (HR = 2.9、95% CI 1.6-5.2、p = 4.5×10⁻⁴) (Fig. 8a)。ERBB2変異は特に予後不良であり (HR = 5.7、95% CI 1.6-20.4、p = 7.2×10⁻³)、5つの独立したゲノム変化 (TP53欠損、CHEK2 LOH、Chr22q消失、Chr15q消失、EGFR変異) のリスクスコアは、1変化あたりの死亡ハザード比約1.9倍の増加と相関した (95% CI 1.5-2.4、p = 3.7×10⁻⁷) (Fig. 8f)。一方、pianoサブタイプの患者は良好な予後を示した (HR = 0.52、95% CI 0.3-0.9、p = 0.03)。特に、n=36 carcinoidsの患者はHR=0.24 (95% CI 0.06-1.0, p=0.05)とさらに良好な予後を示した。
考察/結論
本研究は、SherlockLung研究として232例の非喫煙者肺癌に対して最大規模の全ゲノムシーケンス (WGS) を実施し、体細胞コピー数変化 (SCNA) パターンに基づいた3つのゲノムサブタイプ (piano, mezzo-forte, forte) を確立した。この分類は、従来の組織型分類や単一ドライバー遺伝子分類を超えた包括的なゲノム分類軸を提供するものであり、非喫煙者肺癌の病態理解を大きく進展させる。
先行研究との違い: これまでの研究、例えばCancer et al. Nature 2014やJamal-Hanjani et al. NEnglJMed 2017は主に喫煙者肺癌のゲノムランドスケープを対象としていたが、本研究は非喫煙者特有のゲノム特性を明確に描写した点で対照的である。喫煙者LUADでは全ゲノム重複 (WGD) が60%超で主要なドライバーとされていたが、非喫煙者全体では36%に留まり、forteサブタイプ (95.7%) のみで顕著であった。また、受動喫煙が喫煙直接関連シグネチャーSBS4相当の変異を引き起こさないことを大規模コホートで初めて定量的に示したことも重要であり、非喫煙者肺癌の内因性変異プロセス優位性を支持する。
新規性: 本研究で初めて、ユビキチン活性化酵素1をコードするUBA1遺伝子変異が新規ドライバー候補として同定された。これはユビキチン-プロテアソーム系ならびにDNA損傷応答との関連という新たな発がんメカニズムの視点を提供する。また、pianoサブタイプが示す幹細胞様特性 (長いテロメア、低TMB、高腫瘍内不均一性、KRAS/UBA1/RET/ARID1Aの相互排他的変異パターン、高いSOX2/SOX9/HMGA2発現スコア) は、成体幹細胞の静止状態からの離脱を起源とする仮説と整合し、これまで報告されていない発がん経路を示唆する。
臨床応用: 本知見は非喫煙者肺癌の個別化治療戦略の臨床応用を促進する可能性を秘める。5変数リスクスコア (TP53欠損、CHEK2 LOH、Chr22q消失、Chr15q消失、EGFR変異) による層別化は、死亡リスクを約2倍増加させるゲノム異常を特定し、予後予測に有用である。pianoサブタイプ患者の良好な予後は、KRAS阻害薬や幹細胞シグナル標的薬の可能性を示唆する。一方、forte/mezzo-forteサブタイプはTP53/EGFR/ERBB2標的治療やcollateral lethality戦略の対象となり得る。しかし、pianoの低TMBおよび低HLA LOH頻度は、Rizvi et al. Science 2015やHellmann et al. NEnglJMed 2018で示されたように、免疫療法の恩恵が限定的である可能性を示唆する。
残された課題: 今後の検討課題として、pianoサブタイプの幹細胞起源仮説を単細胞RNA-seqやメチローム解析により検証すること、アジア人を含む多様な民族での本分類の適用性を評価すること、UBA1変異の機能的発がんへの関与を実験的に証明すること、および5リスク因子に基づく早期検出プロトコルの開発が挙げられる。また、受動喫煙による変異が検出閾値以下であったことの生物学的意義を、より高曝露の症例やin vitro/動物モデルを用いて詳細に解明することも重要な課題である。
方法
コホートとシークエンシング: 5施設から232例の治療歴のない非喫煙者肺癌患者(腺癌189例、カルチノイド36例、その他7例)から新鮮凍結腫瘍組織と対応する正常DNA(全血または正常肺組織)を収集した。高カバレッジWGSを実施し、腫瘍組織は平均85×(範囲: 70.6-141.5×)、正常組織は平均31.6×(範囲: 26.2-57.2×)の深度でシーケンスした。患者の平均年齢は64.8歳(範囲: 21-86歳)で、75.4%が女性、97.4%が欧州系であった。受動喫煙曝露歴のある患者は27.6%であった。
ゲノム解析: 一塩基多型 (SNV) および挿入・欠失 (indel) の検出には、MuTect、MuTect2、Strelka v2.9.0、TNscope (TNscopeはハプロタイプベースのバリアント候補検出と機械学習フィルタリングを用いた体細胞変異の正確な検出アルゴリズム) の4つのアルゴリズムを使用し、3つ以上のアルゴリズムでパスした変異を採用した。偽陽性を減らすため、腫瘍のリード深度が12以上、正常組織のリード深度が6以上、腫瘍の変異リードカウントが5以上、正常組織の変異アレル頻度が0.02未満の変異のみを解析対象とした。体細胞コピー数変化 (SCNA)、構造変異 (SV)、全ゲノム重複 (WGD)、HLA LOH (human leukocyte antigen loss of heterozygosity)、テロメア長、kataegisを網羅的に解析した。SCNAの検出にはBattenberg v2.2.8アルゴリズムを使用し、腫瘍純度とploidyを推定した。変異シグネチャーはSigProfiler (SBS-83フォーマット、COSMICデータベース) を用いて解読した。進化的時系列はPlackettLuceパッケージで推定し、クロック様変異 (CpG > TpG) を用いて最近共通祖先 (MRCA: Most Recent Common Ancestor) の出現時期を推定した。ドライバー遺伝子はIntOGenパイプライン (7手法統合) で同定した。35例の腺癌患者ではRNA-seqも実施し、幹細胞様特性の評価に用いた。
統計解析: ゲノム特徴間の比較にはMann-Whitney U検定またはFisher’s exact検定を用いた。生存解析にはCox比例ハザードモデルを使用し、年齢、性別、病期で調整した。多重検定補正にはBenjamini-Hochberg法を適用した。HRDetect v.2.2.8を用いて相同組換え修復欠損 (HRD) スコアを評価した。HLA LOHはLOHHLA (HLA遺伝子のヘテロ接合性喪失を特定するアルゴリズム) アルゴリズムv.1.0で同定した。本研究では、細胞株や動物モデルは使用していない。