- 著者: Tosi D, Laghzali Y, Vinches M, Alexandre M, Homicsko K, Fasolo A, Del Conte G, Durigova A, Hayaoui N, Gourgou S, Gianni L, Mollevi C
- Corresponding author: Diego Tosi (Institut Régional du Cancer de Montpellier-Val d’Aurelle, Montpellier, France)
- 雑誌: Journal of Clinical Oncology
- 発行年: 2015
- Epub日: 2015-05-26
- Article種別: Review
- PMID: 26014300
背景
モノクローナル抗体 (mAb、monoclonal antibody) は、2000年代以降のがん治療において最も急速に拡大した革新的薬剤クラスである。CD20を標的とするrituximab、HER2を標的とするtrastuzumab、EGFRを標的とするcetuximab、VEGFを標的とするbevacizumabなどが相次いで承認され、標準治療としての地位を確立してきた。しかし、これらmAbは従来の細胞傷害性化学療法薬や低分子分子標的薬 (MTA、molecularly targeted agent) とは根本的に異なる薬理学的特性を有している。具体的には、極めて高い標的特異性、長い消失半減期、受容体占有率 (receptor occupancy) の飽和に伴う効果のプラトー化、そして免疫介在性の有害事象リスクなどが挙げられる。それにもかかわらず、初回ヒト投与 (FIH、first-in-human) 第I相試験のデザインにおいては、従来の細胞傷害性薬向けに構築された枠組みがそのまま流用され続けており、その妥当性については長年議論が続いていた。
先行研究の歴史を振り返ると、Le Tourneauら (2009年) は古典的な細胞傷害性薬向けのFIH設計である3+3用量漸増デザイン (3+3 dose escalation) および最大耐量 (MTD、maximum tolerated dose) や推奨第II相用量 (RP2D、recommended phase II dose) の決定方式を概説した。また、Eisenhauerら (2000年) はがん治療薬におけるFIH試験の基本設計を整理した。さらに、Parulekarら (2004年) は非細胞傷害性分子標的薬のFIH試験設計における理論と実装についてレビューを行ったが、当時の分析に含まれたmAb試験は31例中わずか6例のみと極めて限定的であった。2006年のTGN1412 (anti-CD28 superagonist) 事件を契機として、規制当局の視点から安全性確保のためのMABEL (minimum anticipated biological effect level) アプローチが提唱され、Mullerら (2009年) によってその理論化が進められた。さらに、Le Tourneauら (2010年) は低分子MTAのFIH試験81例を分析し、MTD到達率が81%に達すること、3+3デザインの使用率が51%、加速漸増法 (accelerated titration design) の使用率が44%であることを報告した。これらに対抗する代替デザインとして、継続的再評価法 (CRM、continual reassessment method) や、遅発性毒性に対応するTime-to-Event CRM (TITE-CRM) などのベイズ流適応デザインが提唱されてきた。
しかし、これら先行研究の集積にもかかわらず、2014年時点においてmAbに特化したFIH試験デザインの包括的な実態調査は存在しなかった。規制当局のガイドラインは開始用量 (SD、starting dose) の選択基準にのみ焦点を当てており、用量漸増法、用量制限毒性 (DLT、dose-limiting toxicity) の観察期間、RP2D決定基準といった他の重要な設計要素には言及していなかった。また、mAbの長い半減期と急性毒性の希少性を考慮したとき、低分子MTA向けに開発された3+3デザインがmAbに対しても真に適合しているのかという検証が不十分であった。すなわち、前臨床における薬物動態・薬力学 (PK/PD) や毒性データをFIH試験デザインへ統合するための標準的な方法論が確立されておらず、mAb特有の薬理学的特性を反映したFIH試験設計の体系的なエビデンスベースが決定的に不足していた。この知識ギャップ (knowledge gap) を解消し、実態を明らかにすることが強く求められていた。このように、mAb開発の初期段階における最適な試験デザインの設計指針が「不足」しており、いまだ「未解明」な「課題が残されている」のが現状であった。
目的
本研究の目的は、2000年1月から2013年4月までに主要な学術誌に掲載された、がん領域および一部の非がん領域におけるmAb単剤のFIH試験82報を系統的にレビューすることである。具体的には、以下の6つの臨床開発戦略およびアウトカムを定量的に明らかにすることを目的とした。
- 開始用量 (SD) の選択基準の実態 (前臨床毒性試験、PK/PDデータ、あるいはMABELアプローチの採用状況)
- 用量漸増デザインの選択状況 (3+3デザイン、その他のルールベースデザイン、データモニタリング委員会 [DMC、data monitoring committee] の判断、加速漸増デザインの適用率)
- 計画された用量段階数、最高計画用量とSDの比率、およびDLT観察期間の設定状況
- Grade 3-4の重篤な有害事象の発現率、DLTの発現頻度、およびMTDへの到達率
- RP2Dが提示された試験における用量選択の決定根拠 (MTD、最大投与量 [MAD、maximum-administered dose]、PKデータ、PDデータ、あるいは明確な根拠の有無)
- 最終的に決定されたRP2DとMTDおよびMADとの位置関係の定量化
これらの分析を通じて、従来の細胞傷害性薬モデルに依存した試験デザインがmAbの早期臨床開発において抱える限界と課題を浮き彫りにし、今後の新規モダリティ開発に資する合理的な試験設計フレームワークを提言することを目指した。
結果
試験の基本特性と対象疾患: 系統的レビューの結果、最終的に82報のmAb FIH試験が解析対象として抽出された (Figure 1)。対象疾患の内訳は、固形がんが47試験 (57%)、血液腫瘍が20試験 (25%)、その他の疾患 (主に自己免疫疾患や炎症性疾患) が15試験 (18%) であった (Table 1)。試験あたりの登録患者数の中央値は25例 (range 4-207) であった。標的分子は多岐にわたり、CD20 (20%)、EGFR/HER2 (13%)、VEGF経路 (10%) が上位を占めた。具体的な薬剤として、HER2標的pertuzumab、EGFR標的HuMax-EGFr、PD-1標的CT-011、VEGFR-2標的ramucirumab、CS1標的elotuzumab、Endoglin標的TRC105、MUC-1標的AS1402などが含まれていた (Table 3)。
開始用量 (SD) の選択基準と前臨床モデル: SDの選択基準に関して、具体的な決定根拠を本文中に明記していたのは82報中27報 (33%) のみであり、残りの67%の試験ではSDの選択プロセスに関する記載が不十分であった (Table 1)。根拠が示された27報におけるSD決定基準の内訳は、前臨床毒性試験に基づくものが13試験 (48%)、前臨床PK/PDデータに基づくものが8試験 (30%)、両者の組み合わせが6試験 (22%) であった。欧州医薬品庁 (EMA) などの規制当局がTGN1412事件後に推奨しているMABELアプローチを採用したと明記していたのは、わずか3試験 (11%) にとどまった。前臨床安全性評価に用いられた動物種が記載されていたのは17報 (21%) のみであり、そのうちカニクイザルなどの非ヒト霊長類 (nonhuman primates) を用いた試験が10報 (58%)、げっ歯類 (rodents) が3報 (18%)、両者の併用が3報 (18%)、げっ歯類とウサギの併用が1報 (6%) であった。低分子MTAのFIH試験ではげっ歯類モデルが主流であるのに対し、mAb試験では種特異性の観点から非ヒト霊長類モデルが多用されている実態が示された。投与経路は静脈内投与 (IV) が78試験 (96%) と圧倒的多数を占め、皮下投与 (SC) は2試験 (2%)、両経路の併用が2試験 (2%) であった。投与スケジュールは、週1回投与が18試験 (22%)、2週に1回が11試験 (13%)、3週に1回が8試験 (10%) であり、単回投与や不規則な間隔を含むその他が45試験 (55%) であった。ローディングドーズを設定していたのは1試験のみであった。
試験デザインと用量漸増の実態: 用量漸増デザインの詳細が記載されていた71試験のうち、標準的な3+3デザインを採用していたのは41試験 (58%) と最も多かった (Table 1)。その他のルールベースデザインは25試験 (35%)、DMCの合意に基づくデザインは5試験 (7%) であった。低分子MTAのFIH試験で頻用される加速漸増デザイン (accelerated titration design) は、本解析対象の全82試験中わずか5試験 (6%) でしか採用されておらず、mAbのFIH試験におけるきわめて保守的なデザイン選択の傾向が浮き彫りとなった (Figure 2)。計画された用量段階数の中央値は5段階 (range 2-13) であり、4段階が25試験 (31%)、5段階が18試験 (22%)、6段階が14試験 (17%) であった。最高計画用量とSDの比率の中央値は27であったが、その範囲は2から3,333と極めて広範であり、初期段階における有効・安全用量の予測がいかに困難であるかを反映していた (Figure 2)。DLTの観察期間が明記されていた57試験における観察期間の中央値は28日 (range 6-112) であった。また、拡大コホート (expansion cohort) をあらかじめ計画していたのは25試験 (30%) であった。
毒性プロファイルと最大耐量 (MTD) の到達状況: 安全性に関して、全82試験のうち56試験 (68%) において少なくとも1件のGrade 3または4の重篤な有害事象が報告された。しかし、DLTが実際に観察されたのは35試験 (43%) にとどまり、残りの47試験 (57%) では試験期間中に1件もDLTが発現しなかった (Table 2)。DLTの発現数は、1件のみが15試験 (18%)、2件が9試験 (11%)、3件以上が11試験 (13%) であった。最も顕著な結果として、全82試験において実際に投与された最大用量 (MAD) はすべて最高計画用量に到達していた (100%)。しかし、毒性に基づいてMTDが定義できたのは、わずか13試験 (16%) のみであった (Table 2)。これは、低分子MTAのFIH試験におけるMTD到達率81% (Le Tourneauら、2010年) と比較して極めて低い。MTDに到達した13試験におけるMTDとSDの比率の中央値は8 (range 4-1,000) であった。これらの試験では、許容できない毒性が発現した用量段階 (MTD超過用量) もすべて最高計画用量と一致しており、事前に設定された用量段階の範囲内で毒性の限界値に達していた。
推奨第II相用量 (RP2D) の決定根拠: 本レビュー対象のうち、RP2Dが明示されていたのは34試験 (41%) であった。このうち、73%にあたる25試験においては、MTDとは無関係にRP2Dが決定されていた (Table 2、Figure 3)。これら25試験において、RP2DがMAD (最高投与量) と一致していたのはわずか2試験のみであり、残りの23試験ではMADよりも低い用量がRP2Dとして選択されていた。その決定根拠の内訳は、PKデータに基づくものが15試験、PDデータに基づくものが4試験、明確な合理的根拠の記載がないものが4試験であった (Table 3)。PKデータを根拠とした試験では、前臨床モデルで有効性を示した血中濃度と臨床における薬物動態パラメータの比較が主に行われていた。PDデータを根拠とした試験では、標的受容体の占有率 (receptor occupancy) の評価が中心であり、例えばramucirumab (anti-VEGFR-2) では、クリアランスが飽和する8 mg/kg per weekが受容体完全遮断の閾値として選択されていた (Table 3)。また、elotuzumab (anti-CS1) では、骨髄由来の形質細胞上のCS1受容体が95%以上飽和する用量として10および20 mg/kg every 2 weeksが選択されていた。このようなPK/PD主導の用量選択戦略は、後続の高度な抗体関連モダリティ開発、例えば Yu et al. JClinOncol 2023 におけるpatritumab deruxtecan (HER3-DXd) のRP2D (5.6 mg/kg) 決定プロセスなどにも共通する重要なアプローチとなっている。
考察/結論
先行研究との違い: 本研究の成果は、低分子MTAを対象とした過去のFIHレビュー (Le Tourneauら、2010年) と比較して、mAbの早期臨床開発における毒性プロファイルと用量決定プロセスが根本的に異なることを定量的に実証した点にある。低分子MTAでは81%の試験でMTDに到達しているのに対し、mAbではわずか16%にとどまるという事実は、従来の細胞傷害性化学療法薬を前提とした「用量依存的に毒性と効果が増強する」というドグマがmAbには適用できないことを明確に示している。Parulekarら (2004年) が分子標的薬全般の課題として提起した「非毒性エンドポイントによる用量決定」の必要性が、mAbにおいて最も顕著に現れていることが本研究によって裏付けられた。
新規性: 本研究は、2000年から2013年までに発表された82報のmAb FIH試験を対象に、そのデザインとアウトカムを体系的に分析したこれまで報告されていない初の包括的レビューである。特に、RP2Dが提示された試験の73%において、毒性 (MTD) ではなくPK/PDデータや受容体占有率に基づいて用量が選択されている実態を本研究で初めて数値化した。また、mAbの長い半減期 (一般に2-3週間) に対し、DLT観察期間の中央値が28日と極めて短く設定されているミスマッチを指摘し、定常状態に達する前に観察が終了することで遅発性毒性を見逃す潜在的リスクがあることを新規に提起した。さらに、加速漸増デザインの使用率がわずか6%と極めて低く、依然として保守的な3+3デザイン (58%) が主流であるという開発現場の実態を明らかにした。
臨床応用: 本研究の知見は、今後の抗体医薬およびその派生モダリティ (ADCや二重特異性抗体) の早期臨床開発における試験デザインの最適化に直接的な臨床的意義を持つ。mAb開発においては、単一の最高耐量を探索するのではなく、標的飽和度や血中トラフ濃度などのPD/PKマーカーを活用して「最小有効用量」を同定するアプローチが合理的である。臨床現場における具体的な応用例として、cetuximabのEVEREST試験 (Van Cutsemら、2012年) で示されたように、初期毒性の有無に応じて個別に用量を漸増する「more is better」アプローチの妥当性を支持する理論的基盤となる。また、本研究で示されたPK/PD主導の用量設定は、その後の免疫チェックポイント阻害剤、例えば Kojima et al. JClinOncol 2020 で検証されたpembrolizumabなどの開発戦略にも直結しており、bench-to-bedsideの架け橋となる。
残された課題: 今後の検討課題として、第一に、CRMやTITE-CRM、あるいはベイズ流適応デザインなどの高度な統計モデルを実際のFIH試験に前向きに導入し、患者登録の効率化と遅発性毒性の適切な評価を両立させることが挙げられる。第二に、MABELアプローチの記載率が11%と極めて低かったことから、前臨床データからヒト初回投与量を予測するシミュレーション技術の標準化とガイドラインの遵守が必要である。第三に、本研究のlimitationとして、2013年4月までのデータに基づいているため、近年の免疫チェックポイント阻害剤の爆発的普及や、Chapman et al. NEnglJMed 2011 に代表される標的療法時代の進展に伴う複合的免疫療法のFIHデザイン、さらには多重特異性抗体やFc改変抗体などの新世代モダリティにおける実態が十分に反映されていない点が挙げられる。今後の研究方向性として、これらの新規モダリティを対象とした最新のFIH試験デザインのメタ分析を実施し、用量設定基準の進化を体系化することが望まれる。
方法
文献検索と選択基準 (Article Search & Selection):
2013年4月1日に、MEDLINE (PubMed) データベースを用いて系統的な文献検索を実施した。検索式には、MeSH (Medical Subject Headings) 用語およびフィルタを活用し、((('2000/01/01'[Date - MeSH] : '2013/04/01'[Date - MeSH]) AND 'antibodies, monoclonal'[MeSH Terms]) AND 'cancer'[Filter]) AND 'humans'[Filter]) AND 'clinical trial phase I'[Filter] を適用した。対象期間は2000年1月1日から2013年4月1日までとした。包含基準は、peer-reviewed journalに掲載された英語論文であり、かつ新規のmAbを単剤で全身投与した最初のヒト臨床試験 (FIH第I相試験) であることとした。除外基準は、(1) 他の薬剤との併用試験、(2) 抗体薬物複合体 (ADC、antibody-drug conjugate) や放射性免疫複合体 (radioimmunoconjugate) の試験、(3) 局所投与やex vivo処理などの非全身投与試験、(4) 既報の同一薬剤を用いたFIH以外の試験、(5) 非英語論文、(6) 第I相以外の試験、とした。初期検索により672報の文献が抽出され、2名の研究者 (D. Tosi、M. Alexandre) が独立してタイトルとアブストラクトをスクリーニングした。最終的なフルテキストの精読による選択は1名 (D. Tosi) が実施し、最終的に82報を解析対象として同定した (Figure 1)。
データ抽出とクロスチェック (Data Extraction): 抽出対象項目は、薬剤名、対象疾患、登録患者数、投与スケジュール、投与経路、SD、SD選択に用いられた動物種および毒性・PDパラメータ、ローディングドーズの有無、計画用量段階、用量漸増デザインの種類、拡大コホート (expansion cohort) の有無、DLT観察期間、Grade 3-4毒性の有無、DLT発現数、MAD、MTD、RP2D、および各試験の選択基準とした。データ抽出は7名の研究者 (M. Vinches、M. Alexandre、K. Homicsko、A. Fasolo、G. Del Conte、A. Durigova、N. Hayaoui) が分担してスプレッドシートに入力し、D. Tosiが全データのクロスチェックを行った。不一致が生じた場合は、D. TosiとM. Vinchesの2名によるコンセンサスによって解決した。さらに、データの整合性と信頼性を担保するため、2名の統計家 (Y. Laghzali、C. Mollevi) が独立して最終検証を実施した。
統計解析 (Statistical Analysis): 本研究は記述的方法論レビューであるため、解析は記述統計 (descriptive analysis) を中心に構成した。各試験において、(a) 最高計画用量/SD比 (安全かつ治療的に妥当と考えられた初期想定範囲)、(b) MAD/SD比 (実際に臨床評価された用量範囲)、(c) MTD/SD比 (安全と判断された用量範囲) を算出した。これらの比率について、中央値 (median) および範囲 (range) を用いて要約した。解析環境には、STATA software version 13 (STATA, College Station, TX) および R version 3.0.3 (http://www.r-project.org/) を使用した。なお、本研究では生存解析 (Kaplan-Meier法、Cox regressionなど) は対象外とした。本研究は、フランス保健省のプログラム ‘Investissements d’Avenir’ (LabEx MAbImprove Grant No. ANR-10-LABX-53-01) の資金援助を受けて実施された。