• 著者: David Cheek, Martin Blohmer, Martin A. Nowak, Tibor Antal, Kamila Naxerova
  • Corresponding author: David Cheek, Kamila Naxerova (Harvard Medical School)
  • 雑誌: Nature Genetics
  • 発行年: 2026
  • Epub日: N/A
  • Article種別: Original Article
  • PMID: 42086853

背景

がんを引き起こす変異の同定は、がん研究の中心的課題であり、治療法開発の基盤となる。これまでの大半のアプローチは、がんゲノムにおける正の選択シグナル(dN/dS > 1)をドライバー変異の証拠とみなしてきた (Sjöblom et al. 2006; Lawrence et al. 2013; Martincorena et al. 2018)。しかし、近年、正常組織の加齢においても、がんとは無関係に正の選択が広範に存在することが示されている (Martincorena et al. 2015; Watson et al. 2020; Ng et al. 2021)。例えば、NOTCH1は食道扁平上皮癌 (ESCC) で強い正の選択シグナルを示すが、正常食道上皮ではより高頻度に変異しており (Martincorena et al. 2018; Yokoyama et al. 2019)、マウス実験でNOTCH1変異はむしろ発がんを抑制することが示されている (Abby et al. 2023)。この事実は、「正の選択」と「発がん性」が同義ではないことを明確に示しており、両者を概念的・推計的に区別する必要があるという重要な課題を提起している。

従来のドライバー変異の同定手法は、がんゲノムにおける変異頻度や選択圧の評価に焦点を当ててきたが、正常組織における体細胞進化の影響を十分に考慮できていなかった。このため、正常組織の加齢に伴うクローン性拡大を示す変異が、真の発がん性変異と誤認される可能性が指摘されている。特に、高解像度の正常組織データは多くの組織で依然として限られており、発がん性変異の正確な特定には知識ギャップが残されている。このような背景から、正常組織の加齢に伴う選択と、真のがん発生への因果的寄与を区別するための、より洗練された統計的枠組みが不足している状況であった。本研究は、この未解明な領域に焦点を当て、発がん性変異の識別における新たなアプローチを確立することを目指す。

目的

本研究の目的は、変異の「発癌効果 (carcinogenic effect)」を定量的に定義・推定する統計的枠組みを開発し、正常組織加齢での選択と真のがん発生への因果的寄与を区別することである。具体的には、がんゲノムと正常組織ゲノムの変異頻度を比較することで、変異が細胞のがん開始率に与える影響を評価する。さらに、正常組織データが限られている状況でも、患者の年齢データから発癌性情報を抽出できるかを検証し、患者年齢分布が発癌性変異の識別に有用であることを示すことを目指す。これにより、既存のドライバー変異の分類を再評価し、がん予防や治療標的の優先順位付けに資する新たな知見を提供することを目的とする。

結果

がんと正常組織の変異頻度比較から発癌効果を推定: ESCCでは、TP53およびNFE2L2の発癌効果推定値が数百倍と非常に高かった (Fig. 1d)。これに対し、NOTCH1は発がん抑制効果 (発癌効果 < 1) を示すと推定された。EP300、FAT1、PIK3CAなど、ESCCで強い正の選択シグナルを示す遺伝子も、発癌効果推定値は統計的に1に近く、因果的な発がん寄与は限定的であることが示唆された。AMLでは、最も頻繁に変異するNPM1が正常血液では未検出であり、極めて高い発癌効果が示唆された。FLT3、CEBPA、IDH2、WT1は800〜10,000倍の発癌効果と推定された。ASXL1、DNMT3A、TET2、SF3B1は約10倍、TP53は約100倍の発癌効果を示した (Fig. 1e)。これらの結果は、発癌効果が組織間で異なる可能性を示唆している。特に、AMLにおけるNPM1変異は正常血液では検出されず、その発癌効果は極めて強力であると推定された。

患者年齢と発癌性の理論的関係: 分岐過程モデルの理論解析から、以下の2つの重要な予測が導かれた (Fig. 2g)。1. 正常組織で正の選択を受けるが非発癌性の変異は、高齢患者のがんゲノムに優先的に出現する。これは、これらの変異が加齢に伴い正常組織に蓄積し、受動的にがんに受け継がれるためである。2. 強い発癌性変異は、若年患者のがんゲノムに優先的に出現する。これは、これらの変異が発がんの開始を加速するためである。この予測は、選択効果と発癌効果がdN/dSでは区別できない一方、患者年齢分布では区別できることを意味する。このモデルは、細胞の分裂、死、分化、がん化の確率を考慮し、変異がこれらの過程に与える影響を定量化した。

AMLにおける発癌効果と患者年齢の関連: 全21個のAMLドライバー遺伝子の平均患者年齢を算出すると、遺伝子間で大きく分かれた (Fig. 3b)。例えば、KITの平均年齢は36歳であったのに対し、TET2は63歳であった。発癌効果推定値と平均年齢は有意な負の相関を示した (成人発癌効果 rho = -0.44, P = 0.048; 若年発癌効果 rho = -0.5, P = 0.023)。一方、正常血液での変異密度と平均AML年齢は正の相関を示した (rho = 0.61, P = 0.0038)。若年AMLと成人AMLで発癌効果の順位は強く相関する (rho = 0.72, P = 0.00034) が、ドライバー変異頻度の順位は無相関であった (rho = 0.12, P = 0.62)。これは、発癌効果が年齢グループ間で比較的安定していることを示唆する。この解析には合計 n=4,736 patients のAMLデータが用いられた。

正常組織データなしでの発癌性変異の同定: 発癌性なしの帰無仮説下では、正の選択を受ける変異は中性変異より高齢患者のがんゲノムに出現すると予測される (Fig. 4b)。逆に、正の選択かつ若年バイアスを示す変異は発癌性ありとして帰無仮説を棄却できる (Fig. 4c)。乳がんでは、GATA3とTP53が有意な若年バイアスを示したが、PIK3CAは示さなかった (Fig. 4d)。神経膠芽腫では、TP53、IDH1、PIK3CA、BRAF、ATRXが若年バイアスを示したが、PTENとEGFRは示さなかった (Fig. 4e)。ESCC (rho = -0.66, P = 0.012) および大腸がん (rho = -0.65, P = 0.0023) ともに、発癌効果推定値と患者年齢が有意な負の相関を示した (Fig. 4f,g)。これらの結果は、より強力な発癌性変異が若年患者のがんゲノムに優先的に見られるという理論的予測を支持する。乳がんコホートは n=1,562 samples、神経膠芽腫コホートは n=775 cases であった。

SCNAの年齢分布と発癌性: AMLとUK Biobankの正常血液データを用いたSCNA解析で、染色体8番のトリソミーが発癌効果約1,800倍と推定された (Fig. 5a)。SCNAの年齢バイアスは、正常血液での頻度 (正の相関、rho = 0.49, P = 0.028) および発癌効果推定値 (負の相関、rho = -0.54, P = 0.015) と一致した (Fig. 5b,c)。Pan-TCGA解析では、腫瘍抑制遺伝子のSCNA欠失とSNV/小インデルの年齢バイアスは強い正の相関 (rho = 0.62, P = 2.6×10^-6) を示したが (Fig. 5d)、癌遺伝子の増幅とSNVの年齢バイアスは相関がなかった (rho = -0.13, P = 0.45)。これは、腫瘍抑制遺伝子の機能喪失が、変異タイプにかかわらず同様の年齢依存性を示すことを示唆する。この解析では、SCNAが1つ以下のAML n=1,809 samples と正常血液 n=482,043 samples が使用された。

考察/結論

先行研究との違い: 本研究は、体細胞選択と発がん性を推計的に区別する初の統合フレームワークを提供した点で、これまでの研究とは異なる。従来のドライバー遺伝子同定アプローチが正の選択シグナルに依存していたのに対し、本研究は発癌効果という新たな指標を導入し、正常組織の加齢に伴う選択と真の発がん性への因果的寄与を明確に区別した。例えば、PIK3CAのような従来のドライバー遺伝子も実際の発癌寄与は限定的である可能性を示し、これはPIK3CA関連の過成長症候群とがんリスクの相関の乏しさや、PI3K阻害薬の臨床的効果が期待外れであったこと (Hanker et al. 2019) と整合する。

新規性: 本研究で初めて、患者年齢分布が発癌性の独立した情報源として利用可能であることを実証した。特に、より強力な発癌性変異が若年患者のがんゲノムに濃縮されるという新規な知見は、正常組織データがなくても患者年齢分布から発癌性変異を特定できる可能性を示唆する。また、AMLにおける発癌性効果と患者年齢の負の相関 (rho = -0.44, P = 0.048)、および正常血液における選択と患者年齢の正の相関 (rho = 0.61, P = 0.0038) は、両者が異なるシグナルを残すことを明らかにし、小児がんが成人とは異なる変異を必要とするという長年の概念に一石を投じるものである。

臨床応用: 本研究の知見は、がんリスクの評価と管理、および変異ターゲット治療の優先順位付けに重要な臨床的含意を持つ。発癌効果の定量的な評価は、がん予防戦略において、特定の変異の頻度を減少させる、あるいはその効果を阻害する介入の予測可能な結果をもたらす可能性がある。また、治療抵抗性の問題に対し、発癌効果の低い変異を標的とする治療は抵抗性がより問題となる可能性があり、治療標的の選択に役立つ。例えば、PIK3CA変異が発癌効果が限定的であると示唆されたことは、PI3K阻害薬の臨床成績が期待外れであった理由を説明しうる。

残された課題: 今後の検討課題として、本研究で提案された発癌効果の定義が、多段階の発がんプロセスや遺伝子間の複雑な相互作用を単一の数値に集約しているという限界が挙げられる。これにより、無数の生物学的詳細が見落とされる可能性がある。また、COSMICデータの約30%で年齢注記が欠落しており、患者年齢情報を最大限に活用するためには、今後のデータ整備が必要とされる。将来的に、正常組織の大規模データとの統合により、発癌性の定量的評価がさらに精緻化され、変異ターゲット治療の優先付けやがん予防戦略に貢献することが期待される。

方法

発癌効果の定義と推定: 変異zを持つ細胞のがん開始率r1と持たない細胞の開始率r0の比 (w = r1/r0; ハザード比) を「発癌効果」と定義した (Fig. 1a,b)。この発癌効果は、正常組織での変異頻度xとがん検体での変異頻度yのオッズ比 (y/(1-y) ÷ x/(1-x)) を用いて推定された (Fig. 1c)。このオッズ比は、変異ががん化リスクに与える影響の実際的な推定値として採用された。

データソース:

  • 食道扁平上皮癌 (ESCC): Yokoyama et al. (2019) のデータセットから、患者マッチング正常食道上皮68例とESCC検体68例を用いた。非同義変異および小インデルに焦点を当て、がん検体と正常組織検体間で共通の変異を持つ5患者を除外した。
  • 急性骨髄性白血病 (AML): Abelson et al. (2018) および Fabre et al. (2022) の正常血液2,410例と、COSMIC、Bottomly et al. (2022)、Tazi et al. (2022) のAML 2,340例 (年齢範囲36-103歳) を比較した。AMLドライバー遺伝子21個に焦点を当てた。小児AMLコホート (年齢<25歳、n=1,481 patients) の解析では、正常小児血液の変異頻度が低いため、遺伝子長に比例すると仮定して発癌効果を推定した。
  • 大腸がん: COSMICの結直腸がん1,724例と、Lee-Six et al. (2019) および Olafsson et al. (2020) の正常大腸クリプト1,387例を用いた。変異負荷と年齢を共変量とするロジスティック回帰モデルを用いて発癌効果を推定した。

年齢分布モデル: 体細胞進化の分岐過程 (branching process) 確率モデルを定式化し、変異の選択効果と発癌効果が患者年齢分布に与える影響を理論的に解析した (Fig. 2b,c)。このモデルは、細胞の分裂、死、分化、がん化の確率を考慮し、変異がこれらの過程に与える影響を定量化した。

統計解析:

  • 発癌効果の信頼区間: 1,000回のブートストラップ再サンプリングにより95%信頼区間を算出した。
  • AML年齢分布解析: 全21個のAMLドライバー遺伝子について、非同義SNV/小インデルを持つ患者の平均年齢を算出した。発癌効果推定値と平均年齢の相関をSpearmanの順位相関係数で評価した。
  • 正常組織データなしの帰無仮説検定: 発癌性なしの帰無仮説 (発癌効果=1) の下で、正の選択を受ける変異は中性変異より高齢患者のがんゲノムに出現するという予測を立てた。がんゲノムで正の選択を受け、かつ若年バイアスを示す変異は、この帰無仮説を棄却し、発癌性があると判断できるとした。この検定は、乳がん、神経膠芽腫、ESCC、大腸がんのデータに適用された。患者年齢の順列検定により帰無分布を生成し、年齢差統計量の分位数を算出した。
  • 体細胞コピー数異常 (SCNA: somatic copy number alteration) 解析: Tazi et al. (2022) のAML 2,113例とUK Biobankの正常血液482,789例を用いた。染色体腕および全染色体の増幅・欠失の頻度を比較し、発癌効果を推定した。ゲノム不安定性による交絡を軽減するため、SCNAが1つ以下のサンプルに限定した解析も実施した。Pan-TCGA解析では、腫瘍抑制遺伝子の欠失とSNV/小インデル、および癌遺伝子の増幅とSNV/小インデルの年齢バイアスを比較した。年齢バイアスは、患者年齢と変異状態の間の順位相関 (rank biserial correlation) で定義された。