- 著者: Wolchok JD, Hoos A, O’Day S, Weber JS, Hamid O, Lebbe C, Maio M, Binder M, Bohnsack O, Nichol G, Humphrey R, Hodi FS
- Corresponding author: Jedd D. Wolchok (Memorial Sloan-Kettering Cancer Center, New York, NY); F. Stephen Hodi (Dana-Farber Cancer Institute, Boston, MA)
- 雑誌: Clinical Cancer Research
- 発行年: 2009
- Epub日: N/A
- Article種別: Original Article (Methodology / Clinical Translational)
- PMID: 19934295
背景
従来の細胞傷害性化学療法剤 (cytotoxic chemotherapy agents) は、投与開始から数週間以内に標的病変の縮小という形で早期に抗腫瘍効果を発現する。このため、1981年に基盤が策定されたWHO (World Health Organization) 基準 (Miller et al. Cancer 1981) や、その後に簡略化・標準化された RECIST (Response Evaluation Criteria in Solid Tumors) 基準 (Eisenhauer et al. EurJCancer 2009) は、これら細胞傷害性薬剤の早期効果検出を前提として設計された。これらの既存基準では、(1) 新病変の出現、または (2) ベースライン総腫瘍量の 25% 以上の増加が認められた場合、即座に PD (progressive disease、疾患進行) と判定され、治療中止が強く推奨される。
しかしながら、抗 CTLA-4 (cytotoxic T-lymphocyte-associated antigen 4) モノクローナル抗体である ipilimumab (イピリムマブ) やがんワクチン、サイトカイン療法などの免疫療法剤 (immunotherapeutic agents) では、腫瘍特異的な T 細胞応答の誘導や腫瘍内への免疫細胞浸潤に伴う一過性の炎症反応によって、細胞傷害性薬剤とは質的に異なる奏効パターンが観察されることが、一部の症例報告から明らかになっていた (DiGiacomo et al. CancerImmunolImmunother 2009)。具体的には、(a) 治療開始後に一過性の腫瘍量増加 (pseudoprogression) を経た後に腫瘍が退縮する例、(b) 新病変が出現した後に総腫瘍量が低下する例、(c) 持続的な安定 (prolonged stable disease) が長期生存と相関する例などが存在する。これらは既存の WHO や RECIST 基準ではすべて「PD (治療失敗)」と誤判定され、有効な治療が不適切に中止される臨床上の重大な不利益を招いていた。
2004年から2005年にかけて、Cancer Vaccine Consortium (がんワクチンコンソーシアム) 主導のもと、約 200 名の腫瘍専門家、免疫療法家、規制当局の専門家が参加した国際ワークショップが開催され、免疫療法の抗腫瘍活性は発現が遅いこと、PD 判定後の奏効が起こり得ること、確認のない PD での治療中止は不適切であることなどの合意が形成された。しかし、これらの合意を反映した具体的な効果判定基準 (response criteria) の開発は不足しており、従来の評価体系において何が足りなかったかを具体的に定義し、大規模な臨床データを用いて前向きに検証する方法論的基盤が未解明かつ未確立な課題として残されていた。本研究はこの knowledge gap (知識ギャップ) を埋めるため、ipilimumab の第 II 相試験に登録された 487 例の大規模データセットを用いて、新規の効果判定基準を定義・検証することを目的とした。
目的
本研究の目的は、進行メラノーマに対する抗 CTLA-4 抗体 ipilimumab の第 II 相臨床試験 (CA184-008、CA184-022、CA184-007 の 3 試験、計 n=487) の詳細な画像データを用いて、(1) 免疫療法に特有の 4 種類の奏効パターンを系統的に同定・分類し、(2) これらの一過性腫瘍増加や新病変出現を伴う奏効を定量的に捉えるための新規測定基準である irRC (immune-related response criteria) を定義・提案し、(3) 独立評価委員会 (IRC; independent review committee) による中央判定を用いて従来の WHO 基準と irRC を直接比較検証し、irRC による再分類が患者の全体生存期間 (OS; overall survival) とどのように相関するかを予備的に評価することである。
結果
WHO基準による初期奏効率と追跡コホートの推移: ipilimumab 10 mg/kg 投与群 (n=227) において、従来の WHO 基準に基づく IRC 判定の最良総合効果率 (BORR) は 7.5% (17/227) であり、内訳は CR が 0.9% (2/227)、PR が 6.6% (15/227) であった。また、SD は 20.3% (46/227) に認められた。一方で、治療開始 12 週時点で WHO 基準により PD と判定された症例は n=123 例に上った。このうち、急速な臨床悪化を伴わず、代替治療開始前に 16 週、20 週以降も画像追跡が行われた症例は n=57 例であった。なお、早期進行により追跡画像が得られなかった unknown response は n=41 例であった (Table 1)。
irRC適用による奏効例の再分類と4つの奏効パターンの同定: WHO 基準で PD と判定された n=123 例を対象に irRC を適用して再評価を行った結果、n=22 例 (10 mg/kg 治療群 227 例の 9.7%) が、実際には抗腫瘍活性を示す奏効群として再分類された。この 22 例の内訳は、irPR が n=5 例、irSD が n=17 例であった。ウォーターフォールプロット (Fig 2, n=167) において、これら 22 例 (アスタリスク表示) は、新病変の出現や一時的な腫瘍増大を含めているにもかかわらず、最終的には総腫瘍量 (tumor burden) の持続的な減少を示していることが視覚的に実証された。また、WHO 基準で SD と判定されていた 1 例 (patient #148) が、irRC では irPR へとアップグレードされた。 本研究において、ipilimumab 治療下で観察される抗腫瘍効果には、以下の 4 つの明確な奏効パターン (response patterns) が存在することが同定された (Fig 1)。
- Pattern A: 12 週時までに新病変を伴わずに標的病変が縮小するパターン (従来の細胞傷害性薬剤と同様の奏効)。
- Pattern B: 持続的な安定 (stable disease) を経て、その後緩徐かつ持続的に総腫瘍量が減少するパターン。
- Pattern C: 初期評価時に一時的な総腫瘍量の増加 (pseudoprogression) を示した後に、腫瘍が退縮するパターン。
- Pattern D: 新病変が出現したものの、その新病変自体の縮小や既存病変の著明な縮小により、総腫瘍量としては減少するパターン。 Pattern C および Pattern D は、従来の WHO 基準や RECIST 基準では新病変出現や 25% 以上の腫瘍増大をもって即座に PD と判定され、治療失敗とみなされていた領域である。
irRCによる再分類群における全体生存期間 (OS) の改善: Kaplan-Meier 法を用いた生存解析において、irRC の臨床的有用性が強く裏付けられた (Fig 3)。解析対象となった n=227 例を以下の 3 群に分類して比較した。
- (a) WHO 基準での病勢コントロール群 (CR/PR/SD): n=63 例、全体生存期間 (OS) 中央値は 31.2 vs 5.45 months (HR 0.35, 95% CI 0.25-0.49, p<0.001) と、真の PD/unknown 群と比較して極めて良好な長期生存を示した。
- (b) WHO 基準では PD だが irRC で奏効と判定された群 (irPR/irSD): n=22 例、全体生存期間 (OS) 中央値は 未到達 vs 5.45 months (HR 0.28, 95% CI 0.15-0.52, p<0.001) であり、WHO 基準での病勢コントロール群と同等の生存曲線を描いた。
- (c) WHO 基準で PD かつ irRC でも進行と判定された群、および unknown 群: n=142 例、OS 中央値は 5.45 ヶ月 (95% CI 4.5-6.77) であった。 WHO 基準で PD と判定されながらも、irRC によって irPR/irSD と再分類された 22 例は、WHO 基準での病勢コントロール群 (n=63) と同等の極めて良好な長期生存 (comparable survival) を示し、真の PD/unknown 群 (n=142) の OS 中央値 5.45 ヶ月と比較して、統計学的かつ臨床的に極めて有意な予後の違いを示した。
Pseudoprogressionの組織学的裏付け: Pattern C (pseudoprogression) の生物学的妥当性を検証するため、画像上は進行 (PD) と判定された 53 歳男性 (頭皮メラノーマ、M1b 肺転移) の切除生検組織の解析を行った (Fig 4)。ipilimumab 開始 8 ヶ月後に増大を示した肺の主要病変および 3 mm の小結節 2 個を切除したところ、組織学的に広範な壊死 (extensive necrosis) と、著明な T 細胞浸潤 (T-cell infiltrate) が確認され、生存している腫瘍細胞は認められなかった。この組織学的所見は、画像上の「腫瘍増大」や「新病変出現」が、実際には腫瘍細胞の増殖ではなく、治療によって誘導された免疫細胞の局所浸潤やそれに伴う炎症・浮腫を反映していることを直接実証する決定的な証拠となった。
考察/結論
本研究は、がん免疫療法における抗腫瘍効果を正確に評価するための新しい方法論的基盤として、irRC (immune-related response criteria) を世界で初めて系統的に定義し、その臨床的有用性を大規模な前向き臨床試験データを用いて実証した歴史的論文である。
先行研究との違い: 従来の WHO 基準 (1981年) や RECIST 1.0/1.1 基準 (Eisenhauer et al. EurJCancer 2009) は、細胞傷害性薬剤の早期効果判定を前提として設計されており、新病変の出現や 25% 以上の腫瘍増大を即座に「治療失敗 (PD)」と判定していた。これまでの評価基準と対照的に、本研究で提示された irRC は、(1) 新病変の測定可能コンポーネントを総腫瘍量 (total tumor burden) に加算して評価すること、(2) 進行 (irPD) の判定には 4 週以上の間隔をおいた連続 2 回の画像評価による確認 (confirmation) を必須とすること、(3) 持続的な SD を臨床的に意義のある抗腫瘍活性として許容すること、という 3 つの根本的に異なる革新的なアプローチを導入した。先行する Cancer Vaccine Consortium の合意事項 (Hoos et al. J Immunother 2007) を、具体的な数値基準を伴うスコアリングシステムとして実装した点で、これまでのガイドラインから大きく進化している。また、過去の ipilimumab に関する症例報告 (DiGiacomo et al. CancerImmunolImmunother 2009) は、限定的な症例における pseudoprogression を記述するにとどまっていたが、本研究は第 II 相試験プログラム全体 (n=487) を用いて、その発生頻度と生存期間への影響を初めて定量的に明らかにした地平を切り拓いた。
新規性: がん免疫療法の効果判定基準として、irRC を本研究で初めて体系化した点に最大の新規性がある。これまで報告されていない概念として、新病変を tumor burden に組み込む計算式、4 週間以上の間隔をおいた irPD の確認ルール、および irPR (≧50% 減少) や irPD (≧25% 増加) の閾値を新規に提示した。さらに、画像上の進行 (pseudoprogression) が、実際には腫瘍細胞の増殖ではなく、高密度の T 細胞浸潤と広範な腫瘍壊死によるものであることを組織学的に証明したのも、本研究が first to demonstrate である。
臨床応用: 本研究で確立された irRC は、ipilimumab の承認以降、メラノーマのみならず、非小細胞肺がん (NSCLC) を含むあらゆる固形がんにおける免疫チェックポイント阻害薬 (ICI; immune checkpoint inhibitor) の臨床試験において、効果判定のデファクトスタンダードとして急速に普及した。臨床現場における最大の臨床的有用性は、治療開始初期 (12週時など) の見かけ上の病勢進行において、安易に有効な治療を中止せず、患者の全身状態が良好であれば治療を継続するという臨床判断の基準を提供したことである。これにより、従来基準では PD として治療中止されていた患者の約 10% が、治療継続によって長期生存の恩恵 (OS benefit) を享受できるようになった。この概念は、後年に策定された iRECIST (2017年) における unconfirmed PD (uPD) と confirmed PD (cPD) の概念へと直接的に継承されている。
残された課題: 著者ら自身によって、いくつかの limitation が認識されている。第一に、irSD カテゴリには、腫瘍径にほとんど変化がない症例と、一時的に著明に増大した後にベースライン付近まで減少した症例 (実質的な奏効例) が混在しており、これらを同一に扱う点には改善の余地がある。第二に、複数サイクルの進行 (irPD) を経た後に極めて遅れて現れる超遅延型奏効を適切に評価できない。第三に、本解析は第 II 相試験の後ろ向き解析に基づいているため、今後の検討課題として、第 III 相ランダム化比較試験における irRC の前向き検証が必要である。第四に、免疫療法特有の急速な病勢進行であるハイパープログレッション (hyperprogressive disease) などの新しい進行パターンを捕捉する基準は、本論文の時点では未認識であった。今後の研究方向性として、循環腫瘍 DNA (ctDNA) などのバイオマーカーダイナミクスと irRC を統合したハイブリッド評価システムの開発や、人工知能 (AI) を用いた画像解析による pseudoprogression と真の進行の早期鑑別モデルの構築などが挙げられる。
方法
患者および試験デザイン: 本解析は、進行メラノーマ (切除不能な stage III または stage IV) 患者を対象とした 3 つの多施設共同第 II 相臨床試験である CA184-008 試験 (NCT00094653)、CA184-022 試験 (NCT00060372)、CA184-007 試験 (NCT00060333) に登録された計 n=487 例のデータに基づいている。患者の適格基準は、年齢 16 歳以上、ECOG PS (Eastern Cooperative Oncology Group performance status) 0-1、生命予後 16 週以上であり、インターロイキン-2、ダカルバジン、フォテムスチン、テモゾロミド、パクリタキセル、カルボプラチンのいずれかによる前治療歴を有する症例とした。治療プロトコルとして、導入療法 (induction therapy) では ipilimumab 10 mg/kg を 3 週に 1 回、計 4 回投与し、忍容性良好で病勢コントロールが得られた症例には、24週時より 12 週に 1 回の維持療法 (maintenance therapy) を実施した。本解析では、十分な画像追跡データが存在する 10 mg/kg 投与群 (n=227) を主要な解析対象とした。
腫瘍評価 (Tumor assessment): 腫瘍評価は、独立評価委員会 (IRC) が従来の WHO 基準と新規の irRC の両方を用いて独立して実施した。最初の画像評価は、免疫応答の誘導に要する時間を考慮し、導入療法終了時である 12 週時に実施し、その後は 12 週ごとに実施した。WHO 基準で PD と判定された場合でも、急速な臨床症状の悪化 (rapid clinical deterioration) がない限りは ipilimumab の継続投与が許容され、追加の画像検査によって遅延奏効を捕捉するプロトコルとした。
irRC (immune-related response criteria) の定義式: すべての測定可能病変 (measurable lesions) について、直交する 2 径の積の和である SPD (sum of products of perpendicular diameters) を算出し、以下の式を用いて総腫瘍量 (tumor burden) を定義した。 ベースラインで選択された標的病変 (index lesions; 1臓器あたり最大 5 病変、内臓最大 10 病変、皮膚最大 5 病変) の SPD に加え、新たに出現した 5 mm × 5 mm 以上の測定可能新病変 (1臓器あたり最大 5 病変) の SPD を総腫瘍量に直接加算する。判定基準は以下の通り定義した。
- irCR (immune-related complete response): すべての病変の完全消失。4 週以上の間隔をおいた連続 2 回の評価で確認。
- irPR (immune-related partial response): ベースラインと比較して総腫瘍量が 50% 以上減少。4 週以上の間隔をおいた連続 2 回の評価で確認。
- irSD (immune-related stable disease): irPR または irPD の基準を満たさない状態。
- irPD (immune-related progressive disease): 最低値 (nadir) と比較して総腫瘍量が 25% 以上増加。4 週以上の間隔をおいた連続 2 回の評価で確認。
統計解析: 最良総合効果である BOR (best overall response) および最良総合効果率である BORR (best overall response rate)、さらに病勢コントロール率 (DCR; disease control rate) は、Clopper-Pearson 法を用いて正確 95% 信頼区間 (CI; confidence interval) を算出した。全体生存期間 (OS) は Kaplan-Meier 法を用いて生存曲線を描出し、中央値および 95% CI を Brookmeyer-Crowley 法で算出した。安全性は NCI-CTCAE (National Cancer Institute Common Terminology Criteria for Adverse Events) に基づいて評価した。