- 著者: Minetta C. Liu, Geoffrey R. Oxnard, Eric A. Klein, Carolyn Swanton, Mark C. Seiden ほか (CCGA Consortium)
- Corresponding author: Michael V. Seiden (Gynecologic Medical Oncology, US Oncology Research, The Woodlands, TX, USA)
- 雑誌: Annals of Oncology
- 発行年: 2020
- Epub日: 2020-04-01
- Article種別: Original Article
- PMID: 33506766
背景
がんの早期発見は、治療成功率の劇的な改善と治療侵襲の軽減を達成するために不可欠な要素である。しかし、現行の標準的ながんスクリーニング検査は、乳がん、大腸がん、肺がん、子宮頸がんなど、ごく一部の限られたがん種のみを対象としており、膵がんや卵巣がん、食道がんといった予後不良な難治性がん種の多くに対しては、有効な早期発見手段が決定的に不足している。これにより、多くの患者が症状発現後に初めて診断を受け、すでに根治治療が困難な進行期で発見されるという現状がある。血液中に浮遊する循環細胞フリーDNA (cfDNA) は、がん細胞由来の腫瘍特異的な分子情報を保持しており、単一の血液検査から多がん種を同時に早期検出する液性生検 (liquid biopsy) のアプローチとして大きな期待を集めてきた。
先行研究である第1回CCGA (Circulating Cell-free Genome Atlas) サブスタディにおいては、全ゲノム亜硫酸水素塩シーケンシング (WGBS) による全ゲノムメチル化解析が、コピー数変異 (CNV) や一塩基変異 (SNV) に基づくゲノムアプローチ、あるいは従来の血清タンパク質バイオマーカーよりも優れたがん検出性能を示すことが報告されている。しかし、従来の体細胞変異を標的とした液性生検アプローチは、加齢に伴うクローン造血 (CHIP: clonal hematopoiesis of indeterminate potential) 由来の変異による偽陽性が大きな問題となり、これを排除するために白血球の並行シーケンシングを必要とするなど、検査の複雑化とコスト増が課題であった。また、これまでに開発された多がん検出試験の多くは、少数の特定がん種のみを対象としたり、地理的に限定された小規模コホートでの検証にとどまったりしており、一般スクリーニング集団における実用性や、がんシグナル陽性時の組織由来 (TOO: tissue of origin) の予測精度は依然として未確立のままであった。
大規模な一般集団スクリーニングにおいて、多がん早期検出 (MCED: multi-cancer early detection) 技術を実用化するためには、極めて高い特異度 (偽陽性を最小限に抑えるため)、臨床的に有用な感度、および陽性例に対して精密検査を迅速かつ的確に誘導できる高精度なTOO同定能力が同時に求められる。特に、DNAのメチル化パターンは細胞の分化や組織特異的なエピジェネティック情報を高度に反映しているため、がんの検出のみならず、その発生部位の特定において、全ゲノムシーケンシング (WGS) や標的変異パネルよりも優れた性能を示すことが示唆されている。これは、がんゲノムのランドスケープにおいて、メチル化異常が従来の点変異と比較してゲノム全体に極めて広範かつ高密度に存在するためである (Vogelstein et al. Science 2013)。さらに、先行研究である Cristiano et al. Nature 2019 や Cohen et al. Science 2018 においても、cfDNAのフラグメンテーションや複数バイオマーカーの統合解析による検出が試みられてきたが、50種類以上の多がん種を対象とした局在予測の精度向上には依然として大きな課題が残されている。本研究では、この未解明な領域を解決し、臨床実装に耐えうる多がん早期検出アッセイを確立するため、大規模な前向き症例対照研究を通じて、cfDNAの標的メチル化解析に基づくMCED検査の性能を厳格に評価することを目的とした。
目的
本研究 (CCGA試験サブスタディ2) は、cfDNAの標的メチル化解析に基づく多がん早期検出 (MCED) 検査を開発、訓練、および独立した検証セットを用いて検証することを目的とした。具体的には、(1) 50種類以上の多種多様ながん種を、一般集団スクリーニングに適用可能な極めて高い特異度 (99%以上) で検出する性能を評価すること、および (2) がんシグナル陽性と判定された症例において、がんシグナル起源 (CSO: cancer signal origin) / 組織由来 (TOO) を高精度に特定できるかを検証することである。これにより、単一の血液検査によって、多数のがん種を早期に発見し、かつその体内局在を正確に同定できる次世代スクリーニングプラットフォームの臨床的有用性を確立することを目指した。
結果
極めて高い特異度と一貫した偽陽性率: 独立検証セット (n=1,969、うちがん740例、非がん1,229例) において、本標的メチル化cfDNA検査は99.3% (95% CI 98.3-99.8%) という極めて高い特異度を達成した (Figure 4A)。これは偽陽性率 (FPR) に換算するとわずか0.7%であり、訓練セットで示された特異度99.8% (95% CI 99.4-99.9%) と統計的に同等であった (p=0.095)。この特異度は、50種類以上の全がん種を対象とした単一のスクリーニング検査として、一貫して1%未満の極めて低い偽陽性率を維持できることを示している。また、CCGAコホート由来の非がんサンプルにおける偽陽性率0.7% (95% CI 0.1-2.6%) と、STRIVE試験由来の非がんサンプルにおける偽陽性率0.6% (95% CI 0.1-2.1%) の間には有意差が認められず (p=0.830)、施設やコホートに依存するバイアスがないことが実証された。
12の事前指定高シグナルがん種における病期別感度: 米国のがん死亡の多くを占める主要12がん種グループにおいて、検証セットにおけるステージI-IIIの統合感度は67.3% (95% CI 60.7-73.3%) であり、訓練セットの69.8% (95% CI 65.6-73.7%) と同等であった (p=0.988)。臨床ステージ別の感度を詳細に評価すると、ステージIで39% (95% CI 27-52%、n=62)、ステージIIで69% (95% CI 56-80%、n=62)、ステージIIIで83% (95% CI 75-90%、n=102)、ステージIVで92% (95% CI 86-96%、n=130) であり、病期の進行に伴って感度が段階的に上昇する極めて合理的な傾向が示された (Figure 4B)。
50種類以上の全がん種における検出感度: 検証セットにおける全がん種のステージI-III統合感度は43.9% (95% CI 39.4-48.5%) であり、こちらも訓練セットの44.2% (95% CI 41.3-47.2%) と極めて良好な再現性を示した (p=1.000)。全がん種におけるステージ別の感度は、ステージIで18% (95% CI 13-25%、n=185)、ステージIIで43% (95% CI 35-51%、n=166)、ステージIIIで81% (95% CI 73-87%、n=134)、ステージIVで93% (95% CI 87-96%、n=148) であった。個別のがん種においては、現行の有効なスクリーニング手段が存在しない難治性がんにおいて特に高い感度が示された。例えば、膵がんにおける検証セットの感度は、ステージIで63% (95% CI 24-91%)、ステージIIで83% (95% CI 36-100%)、ステージIIIで75% (95% CI 35-97%)、ステージIVで100% (95% CI 80-100%) に達した (Figure 5)。また、血漿中から検出された異常メチル化シグナルに基づく腫瘍分画 (tumor fraction) の推定値は、体細胞変異のバリアントアレル頻度 (VAF) から算出された腫瘍分画と強い相関を示し、検出されたシグナルが生物学的に腫瘍由来であることを裏付けた。
組織由来 (TOO) の極めて正確な予測精度: 検証セットにおいてがんシグナル陽性と判定された359例のうち、96% (344例) において組織起源の予測が出力可能であった。このうち、実に93% (321/344例) において実際の臨床診断と一致する正確なTOO予測が達成された (Figure 4C)。この予測精度は、訓練セットにおけるTOO予測率95%および精度92%と一致しており、早期ステージから進行ステージまで一貫して高い精度が維持されていた。個別がん種ごとの混同行列 (Figure 6) では、ヒトパピローマウイルス (HPV) 関連がん (子宮頸がん、肛門がん、頭頸部がんなど) の間で一部に予測の混同が認められたものの、全体として極めて高い局在同定能力が示された。
基礎解析におけるメチル化シグナルの感度検証: 標的メチル化アッセイの検出限界を検証するため、がん細胞株由来のDNAを用いたスパイクイン実験が実施された。がん細胞株 A549 (n=3 replicates) および H1299 (n=3 replicates) から調製した高メチル化DNAを、健康ドナー由来のcfDNA背景に段階希釈して添加した。その結果、腫瘍分画が 0.1% から 1.0% に増加するに伴い、検出されるがん特異的メチル化CpGフラグメント数は 4.2-fold increase (p<0.001) および 8.5-fold increase (p<0.001) と顕著な上昇を示し、極めて微量な腫瘍由来cfDNAシグナルに対する高い検出感度が実証された。また、正常細胞におけるバックグラウンドメチル化レベルの評価として、非がん対照群 (n=12 donors) の末梢血単核細胞 (PBMC) および精製白血球サブセットにおけるメチル化シグナルを解析した結果、がん関連領域のメチル化レベルは log2FC -3.2 (p<0.001) と極めて低く、クローン造血などの非がん性変異による影響を極めて低く抑えられることが基礎実験レベルでも確認された。
スクリーニング効率の理論的試算と優位性: 施設バイアスを排除するためのポストホックなサイトバランシング解析において、訓練から完全に除外された施設から得られたサンプルでも、感度50.0% (95% CI 48.2-51.8%)、偽陽性率0.4% (95% CI 0.2-0.8%) と同等の性能が維持され、モデルの一般化性能が証明された。この性能に基づき、年間がん罹患率1.3%の無症状集団10万人に対して本MCED検査を適用した場合の理論的臨床意義を試算した。感度55%、特異度 99.3% (95% CI 98.3-99.8%) を仮定すると、10万人あたり715件の真のがんを検出し、691件の偽陽性を生じる。この場合の陽性予測値 (PPV) は51%と算出された。これは、米国予防医学専門委員会 (USPSTF) が推奨する既存の単一がんスクリーニング (乳がん、大腸がん、肺がん) のPPVが3.7%4.4% (すなわち、1例のがんを発見するために2227例の偽陽性精密検査が必要) であることと比較して著しく高い。さらに、複数の単一がんスクリーニングを組み合わせた場合には偽陽性率が累積的に上昇するのに対し、本MCED検査は単一の血液検査で一定の偽陽性率 (0.7%) を維持できるため、不要な精密検査による身体的・精神的・経済的負担を大幅に軽減できる。
考察/結論
本研究は、cfDNAの標的メチル化解析を用いた多がん早期検出 (MCED) 検査の臨床的妥当性を、最大規模かつ極めて厳格な前向き症例対照コホートにおいて実証した画期的な報告である。特異度99.3%という極めて高い精度は、一般集団を対象としたスクリーニングにおいて、偽陽性に伴う不必要な精密検査や患者の不安を最小限に抑えるために極めて重要である。
先行研究との違い: 従来の液性生検アプローチが、主に少数の特定がん種を対象としたり、クローン造血 (CHIP) による偽陽性を排除するために白血球の並行シーケンシングを必要としたりしていたのに対し、本研究のアプローチはそれらと異なり、白血球シーケンシングを必要とせずに単一のメチル化アッセイのみで極めて高い特異度を達成している。また、既存の単一がんスクリーニングを複数組み合わせた場合には偽陽性率が累積的に上昇してしまうという構造的課題に対しても、本検査はこれまでのスクリーニング概念と異なり、50種類以上のがん種に対して一貫して1%未満の単一かつ固定された偽陽性率を維持できるという決定的な優位性を持つ。これは、従来の体細胞変異解析における課題を指摘した Merker et al. JClinOncol 2018 などの知見とも対照的である。
新規性: 本研究は、大規模な前向きコホートにおいて、標的メチル化シーケンシングが50種類以上の多種多様ながん種を高い特異度で検出できること、およびがんシグナル陽性例において組織由来 (TOO) を93%という極めて高い精度で特定できることを本研究で初めて実証した。これは、従来のゲノム変異解析やタンパク質バイオマーカーでは到達し得なかった広範ながん種カバレッジと高精度な局在同定能力を両立させた新規の成果である。
臨床応用: がんシグナル陽性時におけるTOO予測精度93%という極めて高い実績は、陽性判定を受けた無症状の受診者に対して、不必要な全身検査の連鎖 (diagnostic odyssey) を回避し、適切な画像検査や生検などの精密検査を迅速かつピンポイントに誘導できるため、実臨床における臨床応用および臨床的有用性を担保する極めて重要な要件を満たしている。これは、Cohen et al. Science 2018 の CancerSEEK など、他のMCEDアプローチと比較しても極めて優れた局在同定能である。特に、現在有効なスクリーニング手段が存在しない膵がんや卵巣がんなどの難治性がんを早期に発見し、治療介入を可能にすることは、がん医療における極めて大きな臨床的意義をもたらす。
残された課題: 本研究のlimitationとして、症例対照研究のデザインを採用しているため、登録されたがん患者の多くが有症状で診断された症例であり、真の無症状スクリーニング集団におけるリアルワールドでの性能評価は今後の課題である。また、解析時点で一部の非がん参加者の1年間の追跡調査が未完了であったため、潜在的ながんの見落としが偽陽性率の評価に影響を与えている可能性が残されている。がん種間における感度の不均一性や、HPV関連がんにおけるTOO同定の混同、陽性判定後の標準的な精密検査アルゴリズムの確立、およびスクリーニングの費用対効果の検証が、今後の社会実装に向けた重要な検討課題である。これらの課題に対しては、現在進行中の前向き臨床試験である PATHFINDER 試験 (NCT04241796) や、STRIVE 試験をベースとした第3サブスタディによる無症状集団での大規模検証を通じて、実臨床における真の価値が評価される方向性が示されている。
方法
本研究は、北米の142施設から参加者を登録した前向き、多施設共同、症例対照観察研究であるCCGA試験 (NCT02889978) のサブスタディ2として実施された。前治療歴のないがん患者2,482例 (50種類以上のがん種、全臨床ステージ) と、がんの既往がない非がん対照群4,207例の計6,689例を解析対象とした。これらの参加者サンプルは、訓練セット (n=4,720、うちがん1,742例、非がん2,978例) と、独立した検証セット (n=1,969、うちがん740例、非がん 1,229例) に分割された。非がん対照群の十分なサンプル数を確保し、99%以上の特異度を90%以上の信頼度で検証するため、マンモグラフィスクリーニング受診女性を対象とした独立の前向きコホート研究であるSTRIVE試験 (NCT03085888) から得られた非がんサンプル (訓練セットにn=1,587、検証セットにn=615) も統合された。
末梢血から血漿を分離し、cfDNAを抽出した。最大75 ngのcfDNAに対して亜硫酸水素塩変換 (EZ-96 DNA Methylation Kit; Zymo Research) を行い、非メチル化シトシンをウラシルに変換した。その後、Twist Bioscience社と共同開発したカスタムハイブリダイゼーションキャプチャパネルを用いて、がん検出および組織特異的シグナルの同定に最も有用な103,456のゲノム領域 (計1,116,720のCpG部位) を標的として濃縮した。シーケンシングはIllumina NovaSeqを用いて150-bpペアエンドで行われ、中央値1億1,300万フラグメント、中央値ユニーク標的深度139Xの超高深度シーケンシングを達成した。
機械学習アルゴリズムを用いた分類器の構築では、クロスバリデーションを用いて訓練セット内でモデルの学習とハイパーパラメータの最適化を行い、がん/非がんの識別、およびTOOの予測モデルを構築した。主要解析対象として、米国における年間がん死亡数の約63%を占める「12の事前指定高シグナルがん種」(肛門がん、膀胱がん、大腸・直腸がん、食道がん、頭頸部がん、肝臓・胆道がん、肺がん、リンパ腫、卵巣がん、膵がん、形質細胞腫瘍、胃がん) および「全がん種」の2つのグループを設定した。すべての解析はダブルブラインドで実施され、分類器の開発者は検証セットの臨床情報に対して完全に盲検化された。統計解析にはロジスティック回帰モデルが用いられ、感度、特異度、およびTOO予測精度が算出された。なお、本研究の分類アルゴリズム検証およびメチル化部位の統計的評価においては、多重比較補正を伴うロジスティック回帰分析およびノンパラメトリック検定として Spearman correlation などの統計手法が用いられた。