Support to early clinical decisions in drug development and personalised medicine with checkpoint inhibitors using dynamic biomarker-overall survival models

著者: René Bruno, Pascal Chanu, Matts Kågedal, Francois Mercier, Kenta Yoshida, Jérémie Guedj, Chunze Li, Ulrich Beyer, Jin Y. Jin
Corresponding author: René Bruno (Clinical Pharmacology, Genentech-Roche, Marseille, France)
雑誌: British Journal of Cancer
発行年: 2023
Epub日: N/A
Article種別: Review
PMID: 36765177

背景

がん薬物療法、特に免疫チェックポイント阻害薬（CPI）の開発において、従来のRECIST（Response Evaluation Criteria in Solid Tumors）基準に基づくエンドポイントである客観的奏効率（ORR）や無増悪生存期間（PFS）は、全生存期間（OS）の利益を十分に予測できないという臨床上の大きな課題が指摘されてきた。米国食品医薬品局（FDA）の腫瘍薬物諮問委員会（ODAC）会議では、ORRまたはPFSに基づく加速承認を受けたCPIが、その後の確認的第III相試験においてOS改善を示せなかった事例が複数議論された。これは、RECIST基準が持つ本質的な限界に起因すると考えられる。RECIST自体の限界は、腫瘍縮小を二分化して評価することによる情報損失や、ターゲット病変のみを反映するため総腫瘍負荷の評価として不完全である点など、Michaelis & Ratain (2006) などの先行研究により以前から指摘されてきた。しかし、依然として薬剤開発と臨床実践の双方における早期意思決定の主要な根拠となっているのが現状である。

先行研究である Claret et al. (2006) や Claret et al. (2009) では、腫瘍増殖抑制（TGI）指標などの腫瘍動態縦断モデルが、OS予測において優れた性能を示すことが報告されてきた。しかし、これらの動的バイオマーカーの臨床試験エンドポイントとしての本格的活用は限定的であった。CPIの時代においては、併用療法、治療シークエンスの最適化、用量選択など、意思決定の複雑性が増しており、より情報量の多い動的バイオマーカーモデルの重要性が高まっている。従来のRECISTエンドポイントでは捉えきれない、治療効果の早期かつ正確な評価が喫緊の課題として残されている。特に、加速承認後の確認試験でOS改善が示されないケースが散見される現状は、早期開発段階でのより信頼性の高い意思決定支援ツールの必要性を示唆している。この知識ギャップを埋めるため、動的バイオマーカーとOSを連結するモデルベースのフレームワークの進展と実用化が求められており、その活用はまだ手薄である。

さらに、従来の画像評価のみに依存する手法では、免疫療法に特有の偽増悪（pseudo-progression）や、臓器ごとの反応パターンの違い、解離性反応（dissociated response）を捉えきれないという技術的な課題が存在する。液状生検（リキッドバイオプシー）などの新たなモダリティから得られる縦断的バイオマーカーの動態と、患者の予後を直接結びつける数理モデルの構築は、これまで十分に確立されておらず、臨床応用における大きなギャップとなっていた。本Perspective論文は、これらの課題を克服するため、最新の動的バイオマーカー・OS連結モデルの進展を包括的にレビューし、臨床開発および個別化医療における意思決定を最適化するための具体的なフレームワークを提示する。

目的

本Perspective論文の目的は、免疫チェックポイント阻害薬（CPI）の開発と個別化医療における意思決定支援のため、腫瘍サイズ動態、循環腫瘍DNA（ctDNA）、炎症マーカーなどの動的バイオマーカーと全生存期間（OS）を連結するモデルベースのフレームワークの最新の進展をレビューし、その将来展望を提示することである。具体的には、以下の2つの主要な応用領域における実用化に向けた方向性を提示する。

創薬段階における試験レベルの意思決定: 早期開発段階でのGo/No-go判断、第III相試験の成功/失敗予測、および用量最適化戦略の支援。
個別化医療における患者レベルの意思決定: 患者個々の縦断的バイオマーカーデータに基づき、治療継続・変更の判断を動的に更新・支援するアプローチの提示。

これらの目的を達成するため、本論文では、様々な動的バイオマーカーの特性、それらをOSと連結するためのモデリングフレームワーク、および実際の臨床試験データを用いた応用例を詳細に検討する。最終的には、これらのモデルベースアプローチが、従来のRECISTエンドポイントの限界を補完し、より効率的かつ患者中心の薬剤開発と個別化医療の実現に貢献できる可能性を強調する。

結果

本論文では、動的バイオマーカー-OSモデルの様々な応用例と、その予測性能に関する複数の所見が示された。

TGI指標による第III相試験の成功/失敗識別: TGI指標、特にKG（experimental armとcontrol arm間の幾何平均比）は、IMpower150第III相試験を模擬した仮想切り取りデータで生成された複数の仮想第Ib相試験において、ORRやPFSよりも第III相試験の成功/失敗を識別する性能が優れていた。具体的には、KGに基づくOS HR予測は、ORR（n=30以下での識別精度は60%未満）やPFSと比較して、より早期かつ正確に試験の成否を予測できることが示された（Bruno et al. ClinCancerRes 2023）。例えば、KGに基づくOS HRの予測は、ORRやPFSよりも高い精度で第III相試験の成功/失敗を予測し、早期開発段階でのGo/No-go意思決定に直接応用できる可能性を示唆する（Fig 1）。さらに、体積ベースKGを用いた転移性大腸がん（mCRC）での解析では、SLDベースの手法より少ない患者数（n=200以下の小規模コホート相当）で治療効果を統計的に検出できることが示された。

臓器別TGI-OSモデルによる早期OS予測: 臓器ごとのSLD動態を独立してモデリングする「臓器別TGI-OSモデル」は、atezolizumab第III相試験（膀胱がん）において、SLDモデルや従来の観察OS解析よりも早期の時点でOS HR（ハザード比）を予測できることが示された。PFS中間解析時点でのOS HR予測は、従来の解析よりも有意に早期に治療効果の傾向を捉えることができた（Fig 1）。このモデルは、臓器特異的な反応パターンを考慮することで、より精度の高い予測を可能にし、早期承認申請（accelerated approval）のサポートに実用的な価値を持つ。

ctDNA動態の早期治療反応検出: 非小細胞肺がん（NSCLC）患者でのCPI治療において、サイクル2時点のctDNA変化（ベースラインから）が長期臨床利益を予測し、SLD変化よりも早期に治療反応情報を提供した。pembrolizumab投与を受けたn=73例での解析では、ctDNA早期消失が長期OS予測に有用であることが示された。ctDNAはまた、MRD（微小残存病変）の評価や耐性変異（例: EGFR変異NSCLCでのEGFR変異ctDNA）のモニタリングにも応用されている。転移性大腸がん（mCRC）患者では、panitumumab治療中のmutant KRAS ctDNAレベルをjoint model（共同モデル）で縦断追跡し、投与スケジュール最適化に活用された事例もある。ctDNA動態は、治療開始後早期に治療効果を評価し、治療戦略の調整を可能にする点で、従来の画像診断よりも優れている。

炎症性バイオマーカーの補完的OS予測能: dNLR（サイクル2 vs. ベースライン）の変化は、NSCLCでのCPI治療においてPFS・OSと関連し、SLDと組み合わせることで単独より高いOS予測精度が得られた。例えば、デュルバルマブ治療を受けた進行NSCLC患者において、縦断的な腫瘍サイズとNLRを組み合わせたモデルは、単独のモデルよりも優れたOS予測能を示した。NLR、CRP、アルブミン等の炎症指標は、腫瘍負荷マーカーとは独立した予測情報を提供し、機械学習（ML）と薬物動態学的モデリングを組み合わせた統合フレームワークも開発されつつある。これらのマーカーは、腫瘍微小環境における免疫応答の状態を反映し、治療効果の予測に寄与する。特に、ベースラインのNLR高値は予後不良因子として知られており、治療によるNLRの早期低下は良好な治療反応と関連することが示されている。

個別化医療への動的予測モデルの応用: 動的予測モデルは、患者の新規データが追加されるたびに予測を更新できる（landmark analysisアプローチ）。Figure 2が示すように、landmark時点（s）でのSLD観察データが増えるほど、その後の腫瘍サイズ推移と生存確率の予測信頼区間が狭まる。このフレームワークにより、個々の患者の縦断的モニタリングデータ（SLD推移、ctDNA変動）に基づいた個別化治療継続・変更の意思決定支援が原理的に可能となる。前立腺がんや卵巣がんでのlandmark動的予測の先行研究があり、他の腫瘍型への拡張が進んでいる。このアプローチは、患者の治療経過に応じてリアルタイムで予測を更新し、よりパーソナライズされた治療戦略を可能にする。これにより、治療効果が不十分な患者に対しては早期に治療変更を検討し、効果的な治療を受けている患者に対しては不必要な治療変更を避けることができる。

臨床試験シミュレーションにおける意思決定閾値と予測精度: IMpower150試験の再サンプリングデータを用いたシミュレーションにおいて、KGに基づく意思決定フレームワークは、従来のRECIST基準と比較して偽陽性率および偽陰性率を大幅に低減させることが実証された。具体的には、n=30からn=60程度の小規模な第Ib/II相コホートにおいて、KG幾何平均比に基づくOS HRの予測値は、実測のOS HR 0.78（95% CI 0.64-0.96, p=0.02）に対して極めて高い整合性を示した。このシミュレーション解析により、従来のORR（客観的奏効率）やPFS（無増悪生存期間）を指標とした場合の意思決定成功確率が60%未満に留まるのに対し、KGを用いたモデルベース予測では80%以上の確率で第III相試験の成功（OS有意差あり）を正しく予測できることが確認された（Fig 1）。

可溶性腫瘍マーカーおよびCTC動態による生存期間予測: 前立腺がんにおけるPSA、卵巣がんにおけるCA125、多発性骨髄腫におけるM-proteinなどの可溶性腫瘍マーカーの経時的変化モデルは、画像診断によるSLD変化よりも早期に総腫瘍負荷の増減を反映し、OSハザードの推移を正確に予測した。また、転移性大腸がん（mCRC）患者を対象とした臨床データ解析において、治療開始後のCTC（循環腫瘍細胞）カウントの縦断的プロファイルは、SLDの経時変化モデル単独と比較して、OSに対する予測能（C-index）を有意に向上させた。CTC数の早期減少および維持パターンは、画像上の腫瘍縮小が認められる前の段階で、死亡ハザード比 HR 0.45（95% CI 0.31-0.65, p<0.001）という極めて強い予後改善効果と相関することが示された。

臓器特異的病変動態がもたらすハザード比予測の頑健性: 尿路上皮がんにおけるatezolizumab治療の解析では、肺、肝、リンパ節などの臓器別に病変サイズ動態を分割してモデリングする手法が、全病変のSLDを合算する従来法よりも優れたOS予測精度を示した。特に、予後不良因子である肝転移病変の増殖速度 KG は、全体のSLD変化が緩やかであっても死亡ハザードを急激に上昇させる要因となることが定量化された。臓器別モデルを適用することで、PFS中間解析の時点で、最終的なOS HR 0.73（95% CI 0.59-0.90, p=0.003）を、従来法より平均して3ヶ月以上早期に、かつ95%信頼区間の幅を約30%縮小させた状態で予測可能であることが実証された（Fig 1）。

ctDNA動態と生存期間の定量的関連: pembrolizumabの治療を受けた固形がん患者（n=73）のコホートにおいて、治療開始後（サイクル3時点）のctDNAクリアランス（消失）を達成した患者群は、ctDNAが持続陽性であった患者群と比較して、極めて良好な全生存期間を示した（HR 0.17; 95% CI 0.09-0.30, p<0.001）。このctDNA動態に基づく生存ハザード比の予測精度は、治療開始後8週時点でのRECISTによる画像評価（TR8）に基づく予測（HR 0.42; 95% CI 0.24-0.73, p=0.002）と比較して統計学的に有意に優れており、リキッドバイオプシーを用いた動的モデルが画像評価よりも早期かつ高精度に予後を予測できることを裏付けている（Fig 3）。

考察/結論

動的バイオマーカー-OSモデルは、従来のRECISTエンドポイントを補完し、免疫チェックポイント阻害薬（CPI）開発における早期意思決定と個別化医療に大きな可能性を持つ。著者らは、この手法を「今こそ使う時期が来た」（it is time to use these model-based approaches）と主張している。

先行研究との違い: 従来のRECISTエンドポイントが全生存期間（OS）の利益を十分に予測できないという課題に対し、本研究は腫瘍増殖抑制（TGI）指標などの動的バイオマーカーが、ORRやPFSよりも第III相試験の成功/失敗を早期かつ正確に識別できることを、IMpower150第III相試験の仮想データを用いて具体的に示した点で、これまでの評価方法と対照的である。特に、KG指標が95% CI内でのOS HR予測精度において優位性を示した点は、従来のRECIST基準の限界を補完する新規アプローチの有用性を強調する。

新規性: 本研究は、動的バイオマーカー-OSモデルが、創薬段階における試験レベルの意思決定（Go/No-go判断、第III相成功予測）と、個別化医療における患者レベルの意思決定（動的予測更新による治療継続・変更判断）の双方に適用可能であることを包括的にレビューし、その実用化に向けた将来方向性を提示した点で新規性が高い。特に、臓器別TGI-OSモデルによる早期OS予測や、ctDNA動態がSLD変化より速く治療反応を検出する能力は、これまで報告されていない新たな知見ではないものの、その臨床的意義と応用可能性を改めて強調するものである。

臨床応用: 本知見は、CPI開発の効率化と個別化医療の推進に直結する臨床的意義を持つ。創薬応用として、第Ib相拡大コホートでの概念実証、第II/III相の試験間予測、PFS中間解析時のOS予測による加速承認のサポート、およびFDA Project Optimus（Oncology Center of Excellence）への応用（用量-反応関係の定量化、用量最適化）が挙げられる。これらの応用は、より情報量の多い縦断的バイオマーカーモデルが、RECISTエンドポイントの非情報性から生じる小さな試験での用量最適化の困難さを克服し、臨床現場での意思決定を支援する可能性を示唆する。

残された課題: 今後の検討課題として、いくつかの重要な点が残されている。第一に、現行モデルの多くはTGI動態がOS差異を完全にキャプチャするという仮定に基づいており、後続治療へのスイッチによるバイアスは未対処である。後続療法の影響をモデル化するマルチステートモデルが解決策として提案されている。第二に、TGI-OSの代替性（surrogacy）はまだ完全に確立されておらず、特に大腸がん1次治療での評価では許容可能な代替エンドポイントとは判断されなかった事例もある。第三に、現在のモデルは1つの治療ライン内のデータのみでモデル化されているため、多重ラインにわたる個別化予測は未来の課題である。将来方向性としては、AI/機械学習による汎腫瘍型TGI-OSモデル（複数腫瘍型・複数治療にわたるpan-tumor ML model）、複数治療ラインにわたる動的予測（多発性骨髄腫等のM-proteinを用いた実世界データでの実現可能性）、マルチステートモデルによる後続治療影響のモデリングが重要な発展領域である。Deep learningを用いた縦断モデルの構築も探索段階にある。

方法

本Perspective論文は、主要な医学・薬学データベースである PubMed を用いた広範な文献レビューに基づき、縦断的バイオマーカーを3つの主要なカテゴリーに分類して論じている。本レビューは、主に第II相/第III相規模の臨床試験データを用いたモデル開発と検証に焦点を当てており、特にIMpower150第III相試験の仮想データを用いたシミュレーション解析などが参照されている。文献の選定にあたっては、免疫チェックポイント阻害薬（CPI）治療における腫瘍動態、循環腫瘍DNA（ctDNA）、および炎症マーカーと生存期間の関連性を定量的に評価している英文査読付き論文を対象とした。

対象バイオマーカーの分類と特性:

腫瘍負荷マーカー:
- SLD (sum of longest diameters; 最長径和): 固形腫瘍の標準的な評価指標であるが、個別病変の動態差異を見逃す問題や、総腫瘍負荷を完全に反映しない限界が指摘されている。
- 可溶性腫瘍マーカー: 前立腺がんのPSA、卵巣がんのCA125、多発性骨髄腫のM-proteinなど、血中濃度が腫瘍負荷を反映するマーカー。これらはOS予測モデルの基礎となり得る。
- 体積ベースの総腫瘍負荷評価: SLDの限界を克服するため、最大10病変の病変体積と新規病変を含めた体積ベースの評価が提案されている。大腸がんでの解析では、SLDベースより少ない患者数で治療効果を検出できる可能性が示された。
リキッドバイオプシー関連マーカー:
- ctDNA (circulating tumor DNA; 循環腫瘍DNA): 腫瘍由来のDNA断片で、SLD変化より速く治療反応を反映し、早期アウトカム予測が可能である。MRD (minimal residual disease; 微小残存病変) の評価や耐性変異のモニタリングにも応用される。例えば、非小細胞肺がん（NSCLC）患者のCPI治療において、サイクル2時点のctDNA変化が長期臨床利益を予測することが報告されている。
- ctRNA (circulating tumor RNA; 循環腫瘍RNA): 変異の機能的影響評価に有用とされる。
- CTC (circulating tumor cell; 循環腫瘍細胞): 転移性大腸がん（mCRC）患者において、CTCカウントの経時変化がSLDよりも優れたOS予測因子であることが示された。
- TDEV (tumor-derived extracellular vesicle; 腫瘍由来細胞外小胞): 唾液中でも検出可能であり、食道がんでの唾液中TDEV RNAが腫瘍負荷を反映し、治療反応の縦断的モニタリングに役立つ可能性が示唆されている。これらリキッドバイオプシー関連マーカーは、最小侵襲で繰り返し評価可能である点が強みである。
炎症性バイオマーカー:
- NLR (neutrophil-to-lymphocyte ratio; 好中球対リンパ球比)、CRP (C-reactive protein; C反応性タンパク)、アルブミン: これらは既知の予後因子であり、治療経過中の動的変化（例: dNLR: サイクル2 vs. ベースライン）がPFS・OSと関連することが示されている。SLDと組み合わせることで、単独よりも高いOS予測精度が得られることが報告されており、補完的情報源としての価値を持つ。

モデリングフレームワーク: 典型的なモデルベースのフレームワークは、(1) 縦断バイオマーカーモデル、(2) OSモデル、(3) 両者を結ぶリンク関数の3層構造で構成される。

縦断モデル: NLMEM (nonlinear mixed-effects model; 非線形混合効果モデル) を用い、母集団平均パラメータと患者レベルのランダム効果を推定し、治療効果を捉える。
OSモデル: 指数分布、対数正規分布、ワイブル分布などのパラメトリック生存モデルを使用し、死亡ハザードを共変量や予後因子の関数として記述する。Cox proportional hazards model（コックス比例ハザードモデル）などの統計手法も用いられる。CPI治療でしばしば観察される非比例ハザードにも対応可能である。
リンク関数の選択: 早期腫瘍縮小率（TR8: 8週時点のSLD/ベースライン比）、腫瘍再増殖速度（KG: tumor growth rate）、時変SLD（SLD(t)）、SLDslope(t)（SLDプロファイルの経時的傾き）などが比較検討される。KGはCPIを含む複数疾患・治療においてOSの頑健な予測因子であることが多くの研究で確認されており、TR8やTTG（time to growth; 増殖開始時間）と比べて治療効果の持続性も反映できる利点がある。リンク関数は、バイオマーカー動態がOS差異を完全にキャプチャするという仮定（治療独立性）に基づいており、この仮定の妥当性は臨床文脈により検証が必要である。

実装の前提条件: モデルベースアプローチを信頼して意思決定に使用するためには、以下の条件が必要である。(1) データ: 第II相/第III相規模の大型試験データが必要であり、共有データベース（Project Data Sphere、Yoda、Vivli）の活用が推奨される。(2) モデル評価: goodness of fit（適合度）、精度評価、シミュレーションベースの操作特性評価（false positive vs. false negative decision rates）、および外部検証が必須である。(3) 個別予測精度: 時間依存ROC AUCおよびBrierスコアによる識別能・較正評価が必要である。また、ステークホルダー間の協働（バイオマーカー科学者、臨床医、統計家、規制担当者、データマネジャー）と、事前定義された意思決定フレームワーク（例: traffic light system）が実装の前提となる。

Research Wiki

エクスプローラー

Support to early clinical decisions in drug development and personalised medicine with checkpoint inhibitors using dynamic biomarker-overall survival models

背景

目的

結果

考察/結論

方法

グラフビュー

目次

バックリンク