• 著者: Anders B. Dohlman, Robin Mjelle, Henry M. Wood, Kevin Jiang, Alaina Shumate, Iris Lee, Gianmarco Piccinno, Garazi Serna, Abdul-Rakeem Yakubu, Paolo Nuciforo, Phil Quirke, Curtis Huttenhower, Nicola Segata, Matthew Meyerson
  • Corresponding author: Anders B. Dohlman, Matthew Meyerson (Dana-Farber Cancer Institute, Boston)
  • 雑誌: Cell
  • 発行年: 2026
  • Epub日: N/A
  • Article種別: Original Article (Resource)
  • PMID: 42092351

背景

腫瘍マイクロバイオーム (tumor-associated microbiome) は、腫瘍微小環境における重要な構成要素として注目を集めている。しかし、これまでの研究において、がん種間における微生物の存在量や分布、その特異性については相反する報告がなされており、多くの議論が存在する。例えば、Kostic et al. (2012) や Castellarin et al. (2012) は大腸癌 (CRC; colorectal cancer) における Fusobacterium nucleatum の濃縮を報告し、Nejman et al. (2020) は複数のがん種において細胞内細菌が存在することを示した。一方で、Poore et al. (2020) による大規模な pan-cancer マイクロバイオーム解析は、がん種特異的な微生物シグナルの存在を主張したものの、その後の検証研究である Gihawi et al. (2023) や Ge et al. (2025) などによって、シーケンスデータの誤分類や環境汚染、バッチ効果に起因する偽陽性シグナルが多数含まれていることが指摘され、その結論は controversial なものとなった。特に、非バリア部位 (非 barrier 部位) のがんにおける微生物コロニー形成の実態については、依然として多くの部分が未解明であり、研究コミュニティにおける大きな課題となっている。これまでの解析手法では、ホスト (ヒト) 由来配列の除去 (host-subtraction) が不完全であり、これが微生物配列の誤分類を招く一因となっていた。近年、完全なヒト参照ゲノムである T2T-CHM13 が解読されたものの、これを大規模な腫瘍全ゲノムシーケンス (WGS; whole-genome sequencing) データに適用し、徹底的な除染を行った上でマイクロバイオームの実態を検証した研究は不足しており、信頼性の高い pan-cancer マイクロバイオームアトラスの構築には至っていなかった。このように、汚染や技術的ノイズを排除した真の腫瘍マイクロバイオームの分布を明らかにするための、より厳格なパイプラインと大規模コホートでの検証が強く求められていた。

目的

本研究の目的は、完全なヒト参照ゲノムである T2T-CHM13 を組み込んだ、極めて高精度なホスト配列除去および微生物分類パイプラインである「PathSeq-T2T」を構築し、その性能を厳密にベンチマーク検証することである。さらに、このパイプラインを、UK 100,000 Genomes Project (100kGP) から得られた 1万6,000例を超える高深度の腫瘍全ゲノムシーケンス (WGS) データに適用し、徹底的な汚染除去 (除染) プロセスを経ることで、真の腫瘍随伴マイクロバイオームの分布、多様性、および地理的分布 (biogeography) を pan-cancer レベルで明らかにすることを目的とする。また、得られた高精度なマイクロバイオームデータと、宿主腫瘍のゲノム背景 (腫瘍変異量: TMB や遺伝子サブタイプなど) や臨床病理学的特徴 (発症年齢や病期など) との相互作用を解析し、腫瘍マイクロバイオームが宿主の表現型やゲノムコンテキストとどのように関連しているかを解明することを目指す。

結果

PathSeq-T2Tによる極めて高精度なホスト配列除去とベンチマーク性能: in silico 希釈シリーズを用いた検証において、PathSeq-T2T はヒト配列のみのコントロール群からヒト由来リードを 100% 完全に除去し、残存リード数を 0 とすることに成功した (Fig 1A)。これに対し、従来の GRCh38 参照ゲノムのみを用いたフィルタリングでは、ヒトのみのサンプルにおいて 500万本以上のヒトリード ( >17,000 RPM) が誤って残存していた。また、旧バージョンの PathSeq パイプラインでも 5,128本のヒトリード ( ~17 RPM) が残存しており、PathSeq-T2T の優位性が実証された。微生物リードが存在する希釈条件 (n=9 conditions) において、PathSeq-T2T は平均 79.8% ± 7.6% の微生物配列を回収し、その分類精度は 98.3% ± 0.4% に達した (Fig 1B, Fig 1D)。さらに、1:10⁸ の極限希釈条件 (3億本以上の入力リード中にわずか 1本の微生物リードペアが存在する状態) においても、PathSeq-T2T はヒト配列を完全に排除した上で、その唯一の微生物リードを正確に検出し、Veillonella rogosae と分類することに成功した。in vitro 混合実験 (n=3 replicates) においても、PathSeq-T2T は期待される希釈直線性と高い相関を示し、環境汚染由来の Cutibacterium acnes や Staphylococcus epidermidis、Malassezia restricta などの混入を正確に識別した (Fig 1H, Fig 1I)。

除染プロセスによる真の腫瘍マイクロバイオームの同定と口腔消化管がんへの限定: 100kGP コホートの 1万6,369例の腫瘍 WGS データに対し、PCE スコアを用いた除染を行った結果、大半のがん種において微生物シグナルは背景ノイズ (バックグラウンド) と区別不能なレベルまで低下した (Fig 2A, Fig 2B)。除染後に有意な微生物シグナルを維持したのは、口腔消化管がん (orodigestive cancers) にほぼ限定されていた (Fig 3A)。具体的には、大腸癌 (CRC; n=2,482) において最も高い微生物量が検出され (中央値 145 RPM)、次いで口腔咽頭がん (3〜189 RPM)、食道がん (0.3〜24 RPM)、胃がん (0.4〜19 RPM) の順であった。これに対し、非バリア部位のがん種である膠芽腫 (GBM; glioblastoma multiforme; n=295) では、除染後の微生物量はわずか 0.7 RPM であり、これは無菌とされる末梢血 (1.7 RPM) と同等かそれ以下のバックグラウンドレベルであった (Fig 2B)。この結果は、腫瘍マイクロバイオームが全身のあらゆる固形がんに普遍的に存在するわけではなく、基本的には正常時に微生物が定着している粘膜バリア表面のがん種に限定されることを示している。

口腔消化管がんにおける多王国コミュニティの地理的分布: 除染後の口腔消化管がんにおいては、細菌のみならず、真菌、古細菌、ウイルス、さらには原虫 (寄生虫) からなる複雑な多王国 (multi-kingdom) コミュニティが同定された (Fig 3F, Fig 4D)。大腸癌では Bacteroidaceae や Lachnospiraceae が優勢であり、Fusobacteriaceae は大腸癌と口腔咽頭がんの両方で濃縮されていた。胃がんでは、Helicobacter pylori や、酸性環境に適応した Lactobacillaceae が特異的に検出された。真菌においては、Candida albicans が食道がん (7.8%) および胃食道接合部がん (6.9%) で高頻度に検出され、Nakaseomyces glabratus は胃の幽門部 (5.3%) に、Saccharomyces cerevisiae は大腸癌 (5.3%) にそれぞれ部位特異的に分布していた (Fig 4F)。さらに、ヒトの主要な腸内古細菌である Methanobrevibacter smithii が、大腸癌の中でも特に splenic flexure (脾彎曲部、25.9%) および descending colon (下行結腸、25.6%) の腫瘍において高頻度に検出された (Fig 4G)。また、原虫である Trichomonas 属の配列が、HPV (human papillomavirus; ヒトパピローマウイルス) 陰性の男性を中心とする口腔咽頭がん症例の 2.6% から初めて同定され、最大で 12.75 RPM (宿主細胞約1,000個に対し約1個の原虫に相当) の存在量を示した (Fig 4H)。

腫瘍変異量 (TMB) と微生物量との独立した正の相関: 大腸癌コホート (n=2,422) における多変量 PERMANOVA 解析の結果、腫瘍の解剖学的部位 (p<0.001) とゲノムサブタイプ (p<0.001) が、腫瘍マイクロバイオーム組成の最も強力な予測因子であることが示された (Fig 5A)。ゲノムサブタイプ別に見ると、高頻度マイクロサテライト不安定性 (MSI; microsatellite instability) を示す大腸癌は、マイクロサテライト安定 (MSS; microsatellite stable) 大腸癌と比較して 3.9-fold (± 1.1) の微生物量の増加を示し (p=4.61e-28)、POLE (polymerase epsilon; ポリメラーゼ・イプシロン) / POLD1 (polymerase delta 1; ポリメラーゼ・デルタ1) 変異を持つ超高変異型 (polymerase-mutant) 大腸癌では 6.5-fold (± 1.6) の顕著な増加を示した (Fig 5B)。さらに、腫瘍変異量 (TMB; tumor mutation burden) と微生物量との間には、MSS 症例 (R=0.132, p=2.36e-7) および MSI 症例 (R=0.126, p=1.64e-2) の双方において、独立した正の相関?が確認された (Fig 5E)。線形モデルによる解析において、TMB を共変数として組み込むと、MSI (p=0.40) や超高変異型 (p=0.75) といったサブタイプ自体は微生物量の独立した予測因子ではなくなり、TMB こそが微生物量を決定する主要な要因であることが明らかになった (Fig 5G)。この TMB と微生物量との正の相関は、口腔咽頭がん (R=0.145, p=2.4e-2) でも同様に再現された。

高TMBおよび低TMB腫瘍に特異的な微生物種の同定: TMB の高低および腫瘍部位 (近位 vs 遠位) に関連する微生物種を詳細に解析した結果、高 TMB 腫瘍においては、Fusobacterium animalis (q=8.6e-12)、Fusobacterium nucleatum (q=4.8e-11)、Parvimonas micra (q=4.0e-8)、Solobacterium moorei (q=1.4e-8)、および Selenomonas sputigena (q=2.7e-8) といった、口腔由来または歯周病に関連する病原性細菌が著しく濃縮されていることが判明した (Fig 5H, Fig 5I)。これらの種は、腫瘍の進行 (臨床期、Stage I から Stage IV) に伴って相対存在量が増加する傾向を示した (Fig 5K)。これとは対照的に、低 TMB 腫瘍においては、抗炎症作用を持つことが知られている腸内常在菌である Phocaeicola vulgatus (q=7.5e-6)、Faecalibacterium prausnitzii (q=1.7e-6)、および Bacteroides uniformis (q=4.9e-6) が有意に濃縮されていた (Fig 5H, Fig 5J)。

若年性大腸癌における Akkermansia muciniphila の特異的枯渇: 50歳未満で診断された若年性 (early-onset) 大腸癌と、50歳以上の標準発症 (average-onset) 大腸癌の比較解析を行った。MSS 遠位大腸癌 (直腸および下行結腸) に限定した解析において、粘膜バリア機能の維持や抗炎症作用に関与する有用常在菌である Akkermansia muciniphila が、若年性症例において標準発症症例と比較して 12.5-fold (p=3.4e-3) も著しく枯渇していることが明らかになった (Fig 5M)。この A. muciniphila の枯渇傾向は、TCMA (The Cancer Microbiome Atlas; がんマイクロバイオームアトラス) および TCGA (The Cancer Genome Atlas; がんゲノムアトラス) コホートの直腸癌データ (n=10 の若年性症例を含む) を用いた独立検証においても、統計的有意差には至らないものの、同様の方向性 (42.8-fold の枯渇) として再現された (Fig S5N)。

考察/結論

本研究は、完全なヒト参照ゲノム T2T-CHM13 をホスト除去パイプラインに組み込み、徹底的な除染プロセスを適用することで、腫瘍マイクロバイオームの真の姿を pan-cancer レベルで描き出した画期的な成果である。

先行研究との違い: これまでの多くの研究 (例えば Poore et al. (2020) など) は、全身のほぼすべての固形がん種において特異的な腫瘍マイクロバイオームが存在すると報告していた。しかし、本研究の解析結果はこれらこれまでの報告と異なり、徹底的な除染を行った後には、有意な微生物シグナルを維持するのは口腔消化管がんにほぼ限定され、脳腫瘍などの非バリア部位のがん種では背景ノイズと区別できないことを明確に示した。これは、腫瘍マイクロバイオーム研究における偽陽性の問題を浮き彫りにし、分野全体の信頼性を再構築する上で極めて重要な一歩である。

新規性: 本研究は、1万6,000例を超える大規模な WGS コホートにおいて、細菌だけでなく真菌、古細菌、ウイルス、さらには原虫 (Trichomonas 属) までを含む多王国コミュニティの地理的分布を本研究で初めて明らかにした。特に、腫瘍変異量 (TMB) が腫瘍マイクロバイオームの存在量および組成を決定する独立した予測因子であることを新規に同定した点は、学術的に極めて価値が高い。高 TMB 腫瘍における neoantigen (新生抗原) 量の増加に伴う免疫疲弊や局所的な免疫抑制環境が、口腔由来の病原性細菌の定着・増殖を許容する温床となっているという仮説は、宿主ゲノムと微生物との相互作用を説明する新しいモデルを提供する。

臨床応用: 本研究の知見は、がんの診断および治療における臨床応用に直結する。例えば、大腸癌における TMB 高値に関連する特定の口腔細菌群 (Fusobacterium animalis や Parvimonas micra など) は、腫瘍組織から糞便中へと脱落するため、高精度な糞便ベースの非侵襲的スクリーニングや、免疫チェックポイント阻害薬の治療効果予測バイオマーカーとしての臨床的有用性が期待される。また、若年性大腸癌において Akkermansia muciniphila が著しく枯渇しているという発見は、粘膜バリアの破綻が若年者における大腸癌発症に関与している可能性を示唆しており、この有用菌を用いた予防的介入やプロバイオティクス療法の開発など、臨床現場への応用が視野に入る。

残された課題: 一方で、本研究にはいくつかの残された課題 (limitation) も存在する。第一に、バルクの WGS データに基づいているため、検出された微生物が腫瘍細胞内に存在するのか、あるいは腫瘍間質や壊死領域に存在するのかといった空間的な解像度が不足している。第二に、核酸抽出時の微生物細胞壁の溶解効率の差により、一部の微生物量が過小評価されている可能性がある。第三に、TMB と微生物量との相関関係における因果関係 (免疫抑制が微生物増殖を許容するのか、あるいは微生物が免疫抑制を誘導するのか) については、本研究の横断的解析のみでは断定できない。今後の検討課題として、空間的メタゲノミクス技術や単一細胞解像度での解析、およびモデル動物を用いた機能的・機序的な検証が必要である。

方法

本研究では、まずホスト配列除去パイプライン「PathSeq-T2T」を開発した。このパイプラインは、標準ヒトゲノム (GRCh38) にアライメントされなかった残余リードに対し、リードの品質および複雑度 (complexity) によるフィルタリングを行い、さらに主要組織適合遺伝子複合体 (MHC; major histocompatibility complex) などの免疫ゲノム多型領域、既知のブレイクポイント接合部、ベクター配列、および完全ヒトゲノム T2T-CHM13 参照配列に対する追加の subtraction (差し引き除去) を実行する。ホスト配列除去後の非ヒト配列は、Kraken2 (Kraken2 metagenomic taxonomic classification tool; クラーケン2メタゲノム分類ツール)、MetaPhlAn4 (MetaPhlAn4 metagenomic taxonomic profiling tool; メタフィルアン4メタゲノムプロファイリングツール)、および Sylph (Sylph rapid metagenomic profiler; シルフ高速メタゲノムプロファイラー) の 3つの分類器を用いて交差検証され、RPM (reads per million input reads; 入力リード100万本あたりの微生物リード数) として定量化される。

本パイプラインの性能を評価するため、in silico (コンピュータ内) および in vitro (試験管内) の両方でベンチマーク実験を行った。in silico 検証では、17種の細菌・真菌・古細菌からなる微生物コミュニティ標準のシーケンスデータを、ヒトゲノム配列に対して 1:1 から 1:10⁸ までの 9段階の 10倍連続希釈条件で混合したデータセットを作成した。in vitro 検証では、大腸癌細胞株である HCT116 細胞から抽出したヒト DNA と、同様の微生物コミュニティ標準 DNA を同比率で混合し、トリプリケート (3重測定、n=3 replicates) でシーケンスを行った。

次に、このパイプラインを UK 100,000 Genomes Project (100kGP) の 1万6,369例の腫瘍 WGS データ (28がん種、平均カバレッジ約100倍) および 1万5,249例の対応する生殖細胞系列ゲノムデータ (末梢血および唾液) に適用した。環境汚染およびバッチ効果を排除するため、全サンプルに対して PCE (pan-cancer equiprevalence; がん種間等価出現率) スコアを算出した。PCE スコアは、特定の微生物種が特定のがん種に特異的に存在するか、あるいは全がん種に均等に分布しているか (汚染の指標) を 0 から 1 の範囲で数値化するものであり、本研究では PCE スコア 0.7 を除染の閾値として設定した。また、ライブラリ調製における PCR (polymerase chain reaction; ポリメラーゼ連鎖反応) 増幅の影響や、FFPE (formalin-fixed, paraffin-embedded; ホルマリン固定パラフィン包埋) 処理による人工的なシグナルを排除するため、最終的な解析は PCR-free (PCRフリー) かつ新鮮凍結 (fresh-frozen) 検体から得られた solid tumor (固形腫瘍) データに限定した。

統計解析においては、腫瘍マイクロバイオームの組成に対する臨床・ゲノム因子の寄与度を評価するために PERMANOVA (permutational multivariate analysis of variance; 順置多変量分散分析) を使用した。また、2群間の微生物量や多様性の比較には Wilcoxon’s signed-rank test (ウィルコツソンの符号順位検定) を用い、連続変数間の相関には Pearson correlation (ピアソン相関) および線形モデル (linear model) を適用した。