- 著者: Silvana C. E. Maas, Iosune Baraibar, Lea Lemler, Maria Butjosa-Espín, Odei Blanco Irazuegui, Josep Tabernero, Elena Elez, Jose A. Seoane
- Corresponding author: Jose A. Seoane (Cancer Computational Biology Group, Vall d’Hebron Institute of Oncology (VHIO), Vall d’Hebron Barcelona Hospital Campus, Barcelona, Spain)
- 雑誌: Nature Medicine
- 発行年: 2026
- Epub日: 2026-03-12
- Article種別: Original Article
- PMID: 42014507
背景
大腸癌 (CRC: colorectal cancer) は世界で3番目に多い悪性腫瘍であり、癌関連死亡の第2位を占める。CRCは加齢関連疾患として全症例の約90%が50歳以上に発生するが、近年の世界的癌登録データは50歳未満で診断される早期発症大腸癌 (EOCRC: early-onset colorectal cancer) の不均衡な増加を示している。EOCRCは晩期発症大腸癌 (LOCRC: late-onset colorectal cancer) と比較して直腸・左側結腸腫瘍の優位、高頻度の転移、低分化腫瘍という独特の臨床病理学的特徴を持つが、主要なゲノム変異パターンはLOCRCと概ね類似しており、TCGA大規模解析によって両者の分子プロファイルに質的差異が少ないことが示されてきた (Network et al. Nature 2012)。
この発生率増加はライフスタイルおよび環境曝露の変化、すなわちエクスポソーム (exposome) のシフトと時期的に並行しており、エクスポソームがEOCRC増加の原因である可能性が提唱されてきた。しかし、EOCRCに特異的な修飾可能リスク因子を同定する試みはこれまで限定的な成功しか収めていない。先行研究の大部分はEOCRC症例と健常対照を比較する設計を採り、LOCRCにも共通するリスク因子しか浮かび上がらず、EOCRC特異的因子の探索という観点では手薄であった。この根本的な方法論的限界に加え、ほとんどの癌コホートではエクスポソームの直接・定量的測定データが不足しており、曝露と発癌の関連評価を困難にしてきた。近年、腫瘍内エピゲノム不均一性 (epigenomic heterogeneity) が腫瘍進化の重要な基盤となることが認識され (Laisne et al. NatRevCancer 2025)、環境曝露がCpG部位特異的DNAメチル化を通じて腫瘍エピゲノムに長期的な分子印 (molecular footprint) を残すことが網羅的エピゲノムワイド関連研究 (EWAS: epigenome-wide association study) によって明らかにされてきた。DNAメチル化データは多くの癌コホートで利用可能であるため、EWAS由来のメチル化変化を曝露の代理指標として活用するアプローチは、直接曝露データなしにエクスポソームを評価する新しい手段となり得る。しかし、このようなメチル化リスクスコア (MRS: methylation risk score) を用いてEOCRC特異的なエクスポソーム因子を体系的に検証した研究は存在せず、gap in knowledge が残されていた。また、変異シグネチャ (mutational signature) 解析の進展により腫瘍生物学的年齢の分子指標が整備されたが (Alexandrov et al. Nature 2020)、これをEOCRCのエクスポソーム研究に統合した試みも不足していた。
目的
DNAメチル化リスクスコア (MRS) をエクスポソーム曝露の代理指標として構築し、(1) 29項目のライフスタイル・環境因子のうちEOCRC (50歳未満) とLOCRC (70歳以上) の間で有意に異なるものを同定する。(2) 同定された関連を9つの独立コホートのメタ解析で再現・検証する。(3) 米国94郡の21年間の農薬使用データとSEER発生率データを統合し、集団レベルの検証を行う。(4) ピクロラムMRSの生物学的妥当性をiPSC由来心筋細胞のRNA-seqデータで評価し、EOCRCにおける分子メカニズムの探索に資する。
結果
ピクロラムMRS-GWとEOCRCの有意な関連の発見と再現: 発見コホート (TCGA-COAD, n=31 EOCRC vs n=100 LOCRC) において、除草剤ピクロラム (picloram) への曝露を代理するMRS-GW (genome-wide CpG threshold) はEOCRC患者でLOCRC患者に対して有意に高値を示した (P=2.59×10⁻⁵、adj.P=4.41×10⁻⁴) (Fig 1, Fig 3b)。この関連は9コホートのレプリケーションメタ解析 (n=83 EOCRC vs n=272 LOCRC) でも一貫して再現され (OR 1.56, 95% CI 1.16-2.09、p=0.003、adj.P=0.015)、450K arrayのみに限定した感度分析では関連がさらに強まった (OR 1.71, 95% CI 1.25-2.33、adj.P=0.004)。性別調整を基本モデルとし、他全MRSとの相互調整 (Fig 3d)、および腫瘍純度・MSIステータス・腫瘍部位 (左側/右側)・癌家族歴・人種での多変量補正 (Fig 3e) を行っても関連の有意性は維持された。ロバスト性評価として実施した順列テストでは、CpG選択が10,000回中13位、患者年齢分類が1,000回中2位に位置し、偶然による可能性を否定した。
ライフスタイル因子MRSの解析: ライフスタイル因子の解析では、低地中海食スコア (MDS MRS-GW: OR 0.56, 95% CI 0.35-0.85、adj.P=0.033)、低教育レベル (OR 0.49, 95% CI 0.29-0.78、adj.P=0.022)、高喫煙曝露 (smoking-Maas: OR 2.31, 95% CI 1.44-3.92、adj.P=0.009)、低肥満率 (obesity MRS-P1E5: OR 0.39, 95% CI 0.28-0.70、adj.P=0.008) がEOCRCと有意に関連した (Fig 2)。肥満率の低下はTCGA-COADの臨床BMI測定値でも確認され、EOCRC患者のBMI>30の相対リスク (RR) は0.67 (95% CI 0.26-1.76) であった。レプリケーションメタ解析では教育レベルの低下が最も強固に再現され (adj.P=3.59×10⁻⁴)、喫煙曝露 (adj.P=8.6×10⁻⁴) およびMDSの低下 (adj.P=0.046) も確認された。450K限定感度分析でも一貫した傾向が観察された。
ピクロラムMRSの生物学的妥当性と腫瘍分子特徴: 生物学的妥当性検証として、iPSC由来心筋細胞へのピクロラム曝露 (0.2/1/10 μM、GSE262419) から同定した37の差次発現遺伝子 (P<0.005) を用いてTCGA-COADのssGSEAスコアを算出したところ、ピクロラムMRS-GWとの間に強いSpearman相関 (r=0.44、p=2×10⁻¹²) を認め、1,000回遺伝子セット順列テストで6位に位置した (Fig 3f-h)。これはジカンバ (dicamba、r=-0.15、p=0.025) やヘプタクロル (heptachlor、r=-0.15、p=0.017) と比較して顕著に高い相関であり、ピクロラムMRSが実際の農薬曝露の分子フットプリントを反映することを示した (Fig 3f)。腫瘍分子特徴の比較では、高/低ピクロラムMRS-GW三分位 (tercile) 間でMSS腫瘍8遺伝子・MSI腫瘍25遺伝子が差次変異として同定された (Fisher’s exact test、P<0.05) (Fig 4a-d)。年齢・性別・MSI・腫瘍純度・腫瘍部位で調整した差次遺伝子発現解析 (DGEA) では25の差次発現遺伝子 (adj.P<0.05、|log2FC|>1.2) が同定された (Fig 4e)。遺伝子セット濃縮解析 (GSEA) では低ピクロラム曝露群でWnt/β-cateninシグナルが上方制御され (低曝露群でのAPC変異率90% vs 高曝露群74%)、補体経路・IL6-JAK-STAT3シグナルが下方制御されていた (Fig 4f)。
SBS1変異シグネチャを用いた腫瘍生物学的年齢との関連: 診断時暦年齢に依存しない腫瘍年齢の評価として、有糸分裂DNA複製の累積変異量を反映するSBS1 (single-base substitution signature 1) スコアを使用した (MSI腫瘍は除外)。SBS1<60の「若い腫瘍」(n=72) とSBS1≥60の「古い腫瘍」(n=101) に分類したところ、ピクロラムMRS-GWは若い腫瘍と有意に関連した (OR 1.84, 95% CI 1.31-2.66、p=0.000657)。この関連は性別のみ調整後も維持され (p=0.000415)、さらに診断時年齢を追加調整しても有意であった (p=0.00598)。SBS1と腫瘍変異量 (TMB: tumor mutation burden) の間には強い相関が認められたが (Spearman r=0.66、p<2.2×10⁻¹⁶)、ピクロラムMRS-GWとの関連においてSBS1 (P=2.11×10⁻⁵) はTMB (P=0.0148) より強く、SBS1が暦年齢に依存しない年齢特異的なシグナルをより効果的に捉えることが示された。
米国94郡における集団レベルの独立検証: 1992-2012年の農薬使用量推定値と7つのSEER8レジストリが網羅する94郡のEOCRC年齢調整発生率をマッチングした。225種の農薬のうち62種がEOCRC発生率と有意に関連し (線形混合モデル)、7つのSES指標補正後も27種が有意性を維持した (Fig 5a)。27種の農薬同士の相互補正では、ピクロラムが23比較モデル中21モデルで有意性を維持し最もロバストであった (p=0.000452)。グリホサートは同様に21モデルで有意性を維持し次点であった。上位5農薬の統合解析では、ピクロラムが全4農薬補正モデルおよびSES補正モデルの大部分で有意性を保ち、最も一貫したEOCRC関連農薬として同定された (Fig 5c)。グリホサートはIARC (International Agency for Research on Cancer) で「おそらく発癌性がある」と分類されており、本結果との整合性が示された。
考察/結論
本研究は、エクスポソーム研究の根本的課題である癌コホートでの直接曝露データの不在を、EWAS由来のDNAメチル化リスクスコアという新規アプローチで克服し、EOCRC特異的リスク因子の体系的探索を実現した。
先行研究との違い: これまでの研究の多くはEOCRCと健常対照の比較に終始しており、結果としてLOCRCとも共通するリスク因子しか同定できていなかった。本研究はEOCRCとLOCRCを直接比較することで、年齢発症特異的なエクスポソーム差異の同定を可能にした点で既報の研究とは対照的な設計を採っている。また、腫瘍DNA中のエクスポソーム関連メチル化変化を農薬曝露の代理として用い、iPSC由来心筋細胞のRNA-seqデータと統合した妥当性検証手法は、これまでの研究とは相違する新規なアプローチである。さらに、腫瘍生物学的年齢の指標としてSBS1変異シグネチャを活用し、診断時暦年齢とは独立してピクロラム関連を評価した視点も従来にない観点である。
新規性: 本研究で初めて、除草剤ピクロラムへの曝露がEOCRCの新規リスク因子として同定された。この知見は発見コホートエピゲノム解析、9コホートの独立メタ解析、米国94郡21年間の集団データという3つの独立した証拠によって支持されており、エクスポソーム研究における新規な方法論的枠組みの確立という点でも意義深い。また、LOCRC患者は農薬普及前の幼少期を過ごしたのに対し、EOCRC患者は生涯を通じてピクロラム曝露を受けてきたという世代間曝露パターンの違いが、両者のリスク差を説明する新規の仮説として提示されている。ピクロラムを用いて腫瘍分子特徴 (APC変異率、Wnt/β-catenin経路活性化パターン) がFearon-Vogelstein古典モデルとは異なる経路を経る可能性も、これまで報告されていない知見である。
臨床応用: 本知見はEOCRC予防において重要な臨床的意義を持つ。ピクロラムは穀物・肉類副産物を通じた食事曝露が示されており、個人レベルの摂取回避に関する注意喚起とともに、農業製品の規制再評価など政策レベルの対応が求められる。グリホサートの関連も示唆されており、現在IAECが高優先度再評価対象としているアトラジンと合わせ、複数農薬のEOCRC関連評価が臨床現場での公衆衛生的介入の根拠となり得る。教育レベルとEOCRCリスクの関連は、低教育層への癌予防啓発という橋渡し戦略の重要性を示すとともに、EOCRCスクリーニング戦略において農薬曝露歴を含む個別リスク評価の有用性を示唆している。
残された課題: 本研究の主要な limitation として、EOCRC症例数の小ささ (発見コホートn=31、全体n=114) が挙げられ、結腸癌と直腸癌の分離解析では検出力が低下する。農薬曝露データが1992年以降に限定されること、腫瘍発症時期と診断時期の乖藤によるラグ期間の評価が不能なこと、さらにピクロラム誘発エピジェネティック変化の可逆性・用量反応関係の実験的検証が未確立である点も課題である。世界各地域の民族的・社会経済的多様性を反映した大規模プロスペクティブ出生コホートによる因果関係の確立、およびin vivo発癌機序とlatency periodの解明が今後の重要な研究として残されている。また、MRS自体も直接の曝露測定値ではなく代理指標であり、曝露の変化により時間依存性のバイアスが生じる可能性への更なる検討が必要である。
方法
研究デザインとコホート: レトロスペクティブコホートを用いたエピゲノム解析。発見フェーズはTCGA-COAD (結腸腺癌) を使用し、リンチ症候群3例および品質基準不適格10例を除外後、EOCRC n=31 (平均年齢43歳, 女性58%) vs LOCRC n=100 (平均年齢78歳, 女性43%) を解析対象とした (Table 1)。レプリケーションフェーズは9つの独立コホート (TCGA-READ、GSE39958、GSE131013、GSE42752、E-MTAB-7036、GSE199057、GSE101764、GSE77954、E-MTAB-3027) を用い、EOCRC n=83 vs LOCRC n=272 のメタ解析を実施した。
DNAメチル化データ処理: Illumina HumanMethylation450 BeadChip (GSE199057のみEPIC array) で取得したメチル化データをsesameパッケージ (v1.19.7/v1.24.0) で処理し、欠損率>50%のCpGを除去、クロスリアクティブプローブおよびSNP関連CpGを除外した後、Horvathエピジェネティック時計で年齢調整を行い、M値変換を経てβ値に変換した。
エクスポソームMRS構築: 29項目のエクスポソーム特性 (ライフスタイル因子11項目: 地中海食スコア (MDS: Mediterranean Diet Score)、教育レベル、喫煙習慣、BMI、肥満、AHEI、アルコール、コーヒー、出生時体重、大麻使用、smoking-Maas; 大気汚染4項目: NO2、PCB、PM2.5、PM2.5-10; 農薬14項目: ピクロラム、グリホサート、アトラジン、ジカンバ、マラチオン、DDT、ヘプタクロル、リンデン、メソトリオン、メトラクロール、トキサフェン、アセトクロール、クロルデン、2,4-D) について既存EWASから5種の有意水準閾値 (ゲノムワイド (GW): P<1.2×10⁻⁷; P<1.0×10⁻⁵; FDR<0.01/0.05/0.1) でCpGを選択し、63の加重MRSを計算した。
統計解析: EOCRC vs LOCRC の比較には性別調整ロジスティック回帰モデル (stats R package) を用い、メタ解析はmetafor package (v4.4-0) で実施、P値はFDR補正を行った。ピクロラム誘発遺伝子発現の妥当性検証では、iPSC (induced pluripotent stem cell) 由来心筋細胞の農薬曝露RNA-seqデータ (GSE262419; 0.2/1/10 μM) からDESeq2 (v1.44.0) で差次発現遺伝子 (DEG: differentially expressed gene) を同定後、GSVAパッケージ (v1.42.0) でssGSEA (single-sample gene set enrichment analysis) スコアを算出し、MRSとの Spearman相関分析 (Spearman correlation analysis) を行った。分子差異解析にはFisher’s exact test (変異) とDESeq2ベースの負の二項一般化線形モデル (遺伝子発現) を使用し、MSS/MSI別の層別解析を実施した。米国94郡の農薬使用量 (1992-2012年、Pesticide National Synthesis Project) とSEER8 (Surveillance, Epidemiology and End Results) レジストリのEOCRC年齢調整発生率は、年および郡をランダム効果とする線形混合モデル (linear mixed model) で関連を評価し、7つの社会経済指標 (SES) で補正した。順列テスト (permutation test) 10,000回 (CpG選択) および1,000回 (患者分類、遺伝子セット) でロバスト性を評価した。