- 著者: FDA CDER; FDA CBER
- Corresponding author: N/A
- 雑誌: FDA Guidance Document
- 発行年: 2011
- Epub日: N/A
- Article種別: Guideline
- DOI: N/A
背景
非小細胞肺がんである NSCLC (non-small cell lung cancer: 非小細胞肺がん) は、米国におけるがんによる死亡原因の約28%を占める極めて予後不良な疾患であり、本ガイダンスが策定された当時、2010年には約222,520例の新規症例が推定されていた。この重大な公衆衛生上の課題に対し、新規薬剤および生物学的製剤の開発が世界規模で活発に進められており、米国食品医薬品局である FDA (Food and Drug Administration: 食品医薬品局) による規制承認は、臨床試験において適切に測定された有効性エンドポイントの改善を主要な根拠としてきた。しかし、NSCLCにおける許容されるエンドポイントの種類やその適用条件は試験ごとに異なり、開発者間での認識の統一が強く求められていた。特に、腫瘍の測定に基づくエンドポイントは、その測定の主観性や評価バイアスの可能性から、規制上の取り扱いにおいて慎重な議論が必要とされてきた。例えば、TTP (time to progression: 進行時間) や PFS (progression-free survival: 無増悪生存期間) は、オープンラベル試験において評価バイアスを受けやすく、追跡調査のスケジュールが試験群間で非対称である場合にバイアスが生じる可能性が指摘されていたが、これらを克服するための具体的な基準が不足していた。また、ORR (objective response rate: 客観的奏効率) は一般的に使用されるエンドポイントであるものの、NSCLCにおいて OS (overall survival: 全生存期間) との相関が一貫して示されていないという課題があった。
Johnson et al. (2003) や Dagher et al. (2004) の報告でも、サロゲートエンドポイントの利用と限界が議論されており、規制承認における代替指標の妥当性については常に議論の的となっていた。さらに、Sandler et al. (2006) による臨床試験でも、特定の併用療法における生存ベネフィットの検証が行われたが、これらの臨床的意義をどのように規制上のエンドポイントとして位置づけるかという明確な指針は未確立であった。本ガイダンスは、2003年に策定された腫瘍エンドポイントに関する一般ガイダンスを補完するNSCLC特化版として策定された。これは、2003年4月に開催された ASCO (American Society of Clinical Oncology: 米国臨床腫瘍学会)/FDA肺がんエンドポイントワークショップおよび同年12月の ODAC (Oncologic Drugs Advisory Committee: 腫瘍薬諮問委員会) 会議での議論を反映したものである。これらの議論では、OSが依然としてゴールドスタンダードであると認識されつつも、PFSやORRといった代替エンドポイントによる迅速承認経路の可能性が模索されていた。しかし、これらの代替エンドポイントの臨床的意義や測定方法に関する具体的な基準は未確立であり、特に局所進行NSCLCにおけるPFSの通常承認における位置づけについては、ODAC会議でも意見が分かれるなど、明確な指針が不足していた。さらに、PRO (patient-reported outcome: 患者報告アウトカム) の評価についても、その重要性は認識されつつも、信頼性と妥当性を確保するための具体的な要件が不足していた。このような背景から、NSCLC治療薬開発における臨床試験デザインの標準化と、承認申請におけるエンドポイントの明確な定義と測定基準の確立が喫緊の課題として認識されており、この知識ギャップを埋めることが求められていた。
目的
本ガイダンスの目的は、NSCLCを対象とした治療薬および生物学的製剤の通常承認 (regular approval) および迅速承認 (accelerated approval) に用いうる臨床試験エンドポイントについて、FDAの推奨および考え方を明確に提示することである。これにより、開発者が NDA (new drug application: 新薬承認申請) や BLA (biologics license application: バイオ医薬品承認申請) などの規制申請に向けた試験デザインを適切に構築できるよう支援し、承認プロセスの効率化と透明性の向上を図ることを目指す。
具体的には、OS、PFS、ORR、およびPROといった主要なエンドポイントの定義、測定要件、および承認における位置づけに関する詳細な指針を提供することを目的とする。また、PFS解析における進行日やセンサリング日の定義、欠測データの扱い、IRC (independent review committee: 独立画像評価委員会) の重要性についても具体的な考慮事項を示す。さらに、組織型の異質性が治療効果に及ぼす影響を考慮した前向き試験デザインの設計や、非劣性試験における統計学的仮定の限界を明らかにすることで、開発企業が SPA (special protocol assessment: 特別プロトコル査定) などを活用し、強固なエビデンスを創出するための道標を提供することを目的とする。
結果
OSをゴールドスタンダードとする通常承認の基準と実績: OSは、NSCLCにおいて最も信頼性が高く、通常承認の根拠として最優先されるエンドポイントである。死亡という客観的イベントを測定するため評価バイアスが最小であり、患者への直接的な臨床的恩恵を表す。過去の承認実例の大部分はOSの有意な改善に基づいている。例えば、ベバシズマブとパクリタキセル/カルボプラチルの併用療法 (E4599試験、n=878) は、一次治療においてOSの生存期間中央値が 12.3 vs 10.3 months と有意な改善を示し、HR 0.79 (95% CI 0.67-0.92, p=0.003) を達成して通常承認された (Table 1)。また、ペメトレキセドとシスプラチンの併用療法は、非扁平上皮がんのサブグループにおいてOSの有意な改善を示し、HR 0.84 (95% CI 0.71-0.99, p=0.033) を達成して通常承認を支えた。エルロチニブおよびペメトレキセドの維持療法も、OS改善を主要根拠として通常承認されている。肺がんが全がん死亡の約28%を占める疾患特性上、OS改善の示されたレジメンが最優先される原則は一貫して維持されている。OSの計画的中間解析は適切であるが、患者登録完了前のPFS早期中間解析は治療効果を過大評価する可能性があるため推奨されない。
PFSの通常承認への適用条件と局所進行期における制限: PFSを通常承認の主要エンドポイントとして用いるためには、(1) PFS改善の絶対的大きさが臨床的に意味あること、(2) PFS改善がOSまたはQOL改善を反映するエビデンスの存在、(3) 治療毒性が許容範囲であること、の3条件が必要である。ODAC投票では、転移性NSCLCにおいてPFSの通常承認への使用を11対8で支持した一方、局所進行NSCLCでは15対3でPFSのみでは通常承認に不十分と判断された。ただし、局所進行NSCLCにおいてもPFS差が 3.0 months 以上であれば迅速承認の根拠となりうるとされた。また、補助療法NSCLCにおいては、DFS (disease-free survival: 無病生存期間) をエンドポイントとすることが17対2のODAC投票で支持された。PFS測定の主観性から、IRCによる中央判定が強く推奨される (Appendix 2)。PFS進行日の決定方法として、進行が最初に確認できる時点、または予定来院日の2種類の許容可能アプローチが明示された (Appendix 3)。欠損データの扱いは、事前規定の SAP (statistical analysis plan: 統計解析計画) に加えて、3パターンの感度分析を用いた評価が推奨される (Appendix 4)。
ORRの位置づけと迅速承認における代替エンドポイントとしての活用: ORRは、迅速承認の主要な根拠として使用可能であり、単アーム試験での申請も可能である。ゲフィチニブは、既治療の先進的NSCLC患者を対象とした単アーム試験 (n=216) において、ORR 18.7% (95% CI 13.7-24.6, p<0.001) を示し、迅速承認を取得した代表例である (Table 1)。しかし、NSCLCにおいて治療効果のORRへの影響がOSへの対応する効果を予測することが一貫して示されていないため、通常承認の根拠としては原則不十分である。例外として、気道閉塞性NSCLCに対するポルフィマーナトリウムと光線力学的療法は、ORRと腫瘍関連症状改善との相関が証明されており、通常承認の根拠となった。迅速承認後には、確認試験でOSまたはPFS改善を示す必要がある。なお、ペメトレキセドの二次治療承認は、持続的なORRとドセタキセルと比較した毒性軽減を根拠とした通常承認であり、ORR単独が例外的に通常承認を支えた事例である。
患者報告アウトカム(PRO)を用いた症状改善の評価基準: PROは、QOL、症状負担、機能状態といった直接的な臨床的恩恵の指標として重要である。PROを承認エンドポイントとして用いるためには、(a) 内容的妥当性、構成概念妥当性、信頼性、および変化検出能が文書化されていること、(b) 盲検化・無作為化された十分に計画された試験で評価されること、(c) 欠損データの事前規定が必要である。NSCLCは症状が顕著な疾患であるため、適切に測定された症状改善は通常承認の追加的エビデンスとなりうる。PRO評価では、抗がん治療効果と支持療法薬の評価を区別するため、イベントログによる伴用薬記録が推奨される。PROデータの解釈を支援するため、すべてのPRO測定の妥当性が評価される。腫瘍測定データの収集に際しては、CRF (case report form: 症例報告書) を用いてベースライン時の標的病変を正確に記録し、追跡調査での欠損値を防ぐことが極めて重要である (Appendix 1)。
組織型異質性を考慮した試験デザインと非劣性試験の制限: NSCLCの組織型異質性 (腺がん、扁平上皮がん、大細胞がん) による治療効果および毒性の差異を考慮した前向き試験デザイン (事前規定の層別化、サブグループ解析) を推奨する。非劣性試験デザインは、(a) active controlが確立された有効性を持つこと、(b) active controlの効果量が患者集団で推定可能なこと、(c) 保持すべき効果量の割合を事前規定できること、の条件が満たされる場合のみ適用可能である。PFSを主要エンドポイントとした非劣性試験は、active controlの治療効果が時間とともに一定であるという仮定 (constancy assumption) の検証が困難であるため、慎重に扱うよう警告された。開発者は、申請前にFDA多職種チームとの会議を行い、SPAを取得することを推奨する。
考察/結論
先行研究との違い: 本ガイダンスは、先行する2003年一般腫瘍ガイダンスをNSCLC特有の課題に照らして具体化した点で重要な独自性を持つ。これまでの一般的な腫瘍エンドポイントに関するガイダンスと異なり、本ガイダンスはNSCLCに特化した詳細な推奨事項を提供し、特にPFSの測定における主観性やバイアスを最小化するための具体的な方法論的要件を明確に示した点が画期的である。これにより、その後の免疫チェックポイント阻害薬や分子標的薬の多くのピボタル試験が、PFSまたはOSを根拠とした承認を取得するための制度的基盤が確立された。例えば、ベバシズマブの一次治療におけるOS改善 (HR 0.79 (95% CI 0.67-0.92, p=0.003)) は、本ガイダンスがOSをゴールドスタンダードとする根拠を補強するものである。
新規性: 本ガイダンスは、ORRのOSとの相関欠如を明示的に認めながらも迅速承認への使用を許容する現実的な立場と、PFSの通常承認への使用を「原則的に認める」として道を開いた点で新規性がある。本研究で初めて、PFSを主要エンドポイントとして用いる際の厳格なセンサリングルールや、感度分析の具体的なフレームワークが体系的に提示された。これは、サロゲートエンドポイントの利用に関する規制当局の柔軟な姿勢を示すものであり、特定の条件下での迅速な薬剤開発を可能にする。
臨床応用: 本ガイダンスに記載されたPFS解析の標準化手順は、現在も国際標準として機能しており、その臨床的意義は極めて高い。PFS中間解析のタイミング管理や独立画像評価委員会 (IRC) 判定の推奨は、HR 0.79 などの効果量が適切に推定されるための方法論的前提として重要である。また、PROの導入基準は、臨床現場における患者の主観的ベネフィットを客観的に評価するための基盤を提供している。
残された課題: サロゲートエンドポイントとしてのPFSの課題として、ハザード比 (HR) などの数値的改善が小さい場合に臨床的意義の解釈が困難になる点、オープンラベル試験ではアサーテインメントバイアスが生じやすい点が本文書でも明示されている。今後の検討課題として、本ガイダンスが策定された2011年以降に登場した免疫療法固有の遅延効果 (delayed effect) や、循環腫瘍DNA (ctDNA) などのバイオマーカーを用いた新しいエンドポイントの評価基準の策定が挙げられる。また、多国籍共同試験における地域間の医療慣行の差異がPFS評価に及ぼす影響の制御も、依然として残された課題である。
方法
本ガイダンスは、FDAの CDER (Center for Drug Evaluation and Research: 医薬品評価研究センター) および CBER (Center for Biologics Evaluation and Research: バイオロジクス評価研究センター) の規制科学専門家による内部検討、公衆ワークショップでの議論、および ODAC の委員会投票結果の統合に基づき策定された。具体的には、2003年4月15日のASCO/FDA肺がんエンドポイントワークショップおよび2003年12月16日のODAC会議における議論が重要な基盤となっている。これらの会議では、OS、腫瘍評価に基づくエンドポイント、およびPRO測定の利点と欠点が詳細に議論された。
エンドポイント別の定義、測定要件、および承認における位置づけを記述したガイダンス文書として、以下の主要な要素が考慮された。
- 過去のNSCLC承認薬の臨床試験データ: 過去の承認において各エンドポイントがどのように用いられてきたかが整理された。例えば、ベバシズマブとパクリタキセル/カルボプラチルの併用療法に関する臨床試験 (NCT00021060) はOSを主要エンドポイントとして承認されており、その臨床的意義が強調された。
- ODAC投票結果の反映: 特に、補助療法における DFS (disease-free survival: 無病生存期間) のエンドポイントとしての妥当性 (17対2で支持)、転移性NSCLCにおけるPFSの通常承認への使用 (11対8で支持)、および局所進行NSCLCにおけるPFSのみでの通常承認の不十分性 (15対3で不十分と判断) といった投票結果がガイダンスに明示的に反映された。
- PFS解析の方法論的要件: PFSの測定における主観性やバイアスを最小化するため、IRCによる中央判定が強く推奨される。進行日の定義方法として、進行が最初に確認できる時点、または予定来院日の2種類の許容可能アプローチが明示された。欠損データの扱いは、事前規定の SAP (statistical analysis plan: 統計解析計画) に加えて、3パターンの感度分析を用いた評価が推奨される。主要解析では、臨床的進行が文書化されていない、がん治療の変更、またはパフォーマンスステータスの低下のために試験を中止した患者は、最後の適切な腫瘍評価日で打ち切られる。これらの解析は、カプラン・マイヤー (Kaplan-Meier) 法やログランク (log-rank) 検定、コックス回帰 (Cox regression) などの統計手法を用いて実施されることが想定された。
- PROエンドポイントの評価基準: PROが直接的な臨床的恩恵の指標となりうるための要件として、内容的妥当性、構成概念妥当性、信頼性、および変化検出能が文書化されていること、盲検化・無作為化された試験で評価されること、および欠損データの事前規定が必要であることが明記された。
- 試験デザイン上の追加的考慮事項: NSCLCの組織型異質性を考慮した前向き試験デザイン、非劣性試験デザインの適用条件、およびSPAの活用が推奨された。非劣性試験については、PFSを主要エンドポイントとする場合の constancy 仮定の検証困難性から、慎重な取り扱いが求められた。
本ガイダンスの策定にあたっては、PubMed や Embase などの学術データベースに蓄積された過去の臨床試験データや、ICH (International Council for Harmonisation: 日米EU医薬品規制調和国際会議) E9「臨床試験のための統計的原則」および E10「対照群の選択とそれに関連する諸問題」の原則との整合性が十分に確保された。