- 著者: Hui Yu, Theresa A. Boyle, Caicun Zhou, David L. Rimm, Fred R. Hirsch
- Corresponding author: Fred R. Hirsch (UC Denver-Anschutz Medical Campus, Department of Medical Oncology, Aurora, CO, USA)
- 雑誌: Journal of Thoracic Oncology
- 発行年: 2016
- Epub日: 2016-04-23
- Article種別: Review
- PMID: 27117833
背景
PD-L1 (programmed death ligand-1) とPD-1受容体の相互作用を遮断する免疫療法 (nivolumab, pembrolizumab, atezolizumab, durvalumab, avelumabなど) は、進行肺がん患者の生存率を劇的に改善した。PD-L1蛋白質発現は免疫組織化学 (IHC) で測定され、PD-1/PD-L1阻害薬への奏効を予測する重要なバイオマーカーとして注目されている。しかし、これまでの臨床試験では、異なる薬剤、診断会社、およびIHCプラットフォーム間で、異なる抗体クローン (例: 22C3, 28-8, SP142, SP263)、スコアリングシステム、および陽性判定カットオフが使用されてきたため、統一的な解釈が困難であるという課題が存在する。例えば、FDAはpembrolizumabに対して22C3 pharmDxを「companion diagnostic」として、nivolumabに対して28-8 pharmDxを「complementary diagnostic」として承認しているが、これらのアッセイ間の互換性や標準化は未確立であった。
nivolumabの第I相試験において、Topalian et al. NEnglJMed 2012は、PD-L1 IHC陽性腫瘍における奏効を初めて体系的に報告した。しかし、その後のCheckMate 017 (Brahmer et al. NEnglJMed 2015) およびCheckMate 057 (Borghaei et al. NEnglJMed 2015) 試験では、複数のカットオフ値 (1%, 5%, 10%) が設定されたものの、その予測性は一貫せず、PD-L1のバイオマーカーとしての役割は「controversial」な問題として残された。また、KEYNOTE-001 (Garon et al. NEnglJMed 2015) およびKEYNOTE-010 (Herbst et al. Lancet 2016) 試験では22C3クローンと腫瘍細胞陽性率 (TPS) 1%および50%が採用されたが、これらの試験間の直接比較は「未解明」のままであった。抗体およびプラットフォームを統一した前向き検証データが「不足」しており、本レビューは、肺がんにおけるPD-L1検出と解釈の標準化に向けた課題を整理することを目的とする。
目的
本レビューの目的は、肺がんにおけるPD-L1バイオマーカーとしての歴史的経緯を概観し、異なるIHC抗体クローンおよびプラットフォーム間の比較、PD-L1検出および解釈における主要な課題(腫瘍内異質性、偽陽性/偽陰性リスク、組織処理の影響、先行治療の影響)を詳細に検討することである。さらに、PD-L1 mRNA発現、腫瘍変異量 (TMB)、マイクロサテライト不安定性 (MSI)、PD-L2発現などの他のバイオマーカーの役割についても概説する。最終的に、PD-L1バイオマーカーの標準化に向けた今後の方向性を議論し、患者ケアの最適化に資する情報を提供することを目指す。
結果
PD-L1がバイオマーカーとして登場した経緯: Topalian et al. NEnglJMed 2012による最初のnivolumab第I相試験では、5H1抗体を用いたPD-L1陽性腫瘍患者4例中3例がnivolumabに奏効し、PD-L1陰性腫瘍患者5例中0例が奏効した。その後の追跡試験では、PD-L1陽性患者25例中9例が奏効し、陰性患者17例中0例が奏効した。複数の第I-II相解析では、PD-L1陽性腫瘍の客観的奏効率 (ORR) はPD-L1陰性腫瘍の2-3倍高い傾向が示されたが、一部の陰性例でも奏効が観察された。PD-L1の予後意義については、良好、不良、または無相関と報告が矛盾しており、これはIHC技術の非標準化と真のコホート差に起因すると考えられる。例えば、Thompsonら (2004) は腎細胞がんにおいてPD-L1高発現が予後不良因子であると報告したが (p=0.0001)、その後の大規模解析では有意な相関は認められなかった。Brahmer et al. NEnglJMed 2012による抗PD-L1抗体BMS-936559の第I相試験では、PD-L1 IHC陽性NSCLC患者の奏効率は36% (n=11例中4例) であり、陰性群では0%であったことから、PD-L1がコンパニオン診断候補として確立される道が開かれた。さらに、PD-L1 mRNAと蛋白質発現の乖離 (mRNA陽性だが蛋白質陰性の症例が複数試験で20-30%存在) が確認されており、転写後調節がIHC評価の限界となる可能性が示唆された。
主要PD-L1抗体と標的ドメインの多様性: PD-L1検出には、(1) 5H1 (Lieping Chen Lab, 非商業用)、(2) 28-8 (Dako, nivolumab用)、(3) 22C3 (Dako, pembrolizumab用)、(4) SP142 (Ventana, atezolizumab用)、(5) SP263 (Ventana, durvalumab用)、(6) E1L3N (Cell Signaling, 研究用) など、複数の抗体クローンが使用されている (Figure 1)。E1L3NとSP142はPD-L1の細胞内ドメインを認識する一方、28-8、22C3、SP263、およびE1J2J (研究用抗体) は細胞外ドメインを認識する。SCLCにおけるPD-L1陽性率は、IshiiらおよびKomiyaら (Abcam抗体) の報告では71.6%および82.8%と高かったが、Schultheisら (E1L3Nおよび5H1抗体) の報告では腫瘍細胞で0%、腫瘍浸潤免疫細胞 (TIIC) で18.5%と大きな差が見られた。NSCLCの陽性率は、5%のカットオフ値で24-60%と広範囲に変動する (Table 1)。
判定カットオフの多様性: PD-L1陽性の定義には様々なカットオフ値が用いられてきた。Dongら (初期) は10%/40%/80%で-/+/++/+++と分類した。Topalian et al. NEnglJMed 2012は5%を閾値として採用し、これは主に背景ノイズ対策のためであったと考えられる。Garon et al. NEnglJMed 2015 (KEYNOTE-001) はROC解析により50%をカットオフとして選定した。CheckMate 017/057 (nivolumab) では1%、5%、10%の複数カットオフが評価された。Atezolizumab (SP142) は腫瘍細胞 (TC) とTIICの両方を0/1/2/3 (<1%/1-5%/5-10%/≥10%) でスコアリングする。各薬剤および試験でカットオフ値とスコアリング対象が異なり、相互互換性が欠如している (Table 1)。
異質性と偽陽性/偽陰性リスク: VelchetiらによるAQUA (Automated Quantitative Analysis) 定量蛍光解析では、同一腫瘍の異なるコア間でのPD-L1発現の線形回帰係数は0.53-0.59と中程度の不均一性が示された (Figure 2)。McLaughlinらはE1L3NとSP142を49例のNSCLCで比較し、陽性/陰性判定が約25%で不一致であったことを報告した。低カットオフ (1%、5%) では偽陽性/偽陰性リスクが高い。単一ブロック評価は腫瘍内不均一性を反映しない可能性がある。術後NSCLCの解析 (n=26) では、5コア間でのPD-L1 IHC一致率が50%未満の症例が31% (8/26例) に達し、生検部位に依存する偽陰性リスクが実証された。原発巣と転移巣間のPD-L1発現不一致率は複数の報告で30-40%に達しており、原発巣生検のみによる判定の限界が示唆されている。空間的不均一性に対処するため、複数部位・複数コアからの評価や、cfDNA (circulating free DNA) を用いた非侵襲的リキッドバイオプシーによる動的評価が検討されている。
組織処理の影響: 腎がん検体での比較では、FFPE (ホルマリン固定パラフィン包埋) 組織 (24%) は凍結組織 (37%) よりもPD-L1陽性率が低く、ホルマリン固定によるPD-L1抗原性の喪失が示唆された。長期保管されたスライドでは陽性染色が消失する報告があり、10年以上保管されたブロックでは測定可能な染色が得られないケースも報告された。固定時間 (推奨: 6-24時間)、温度、および抗原賦活化プロトコル (HIER: heat-induced epitope retrieval) の標準化が不可欠である。NSCLCの実臨床では、生検採取法 (コア針生検、経気管支生検、胸水細胞診) の違いもPD-L1評価精度に影響を及ぼし、腫瘍細胞数が少ない小生検検体では偽陰性リスクが上昇するため、検体品質の事前評価が求められる。
化学療法・分子標的薬の影響: 化学療法やTKI (チロシンキナーゼ阻害薬) 治療により、IFN-gamma (インターフェロンガンマ) 経路を介してPD-L1発現が誘導される可能性があり、治療前の診断検体の結果が免疫療法開始時の腫瘍PD-L1状況を正確に反映しない懸念がある。EGFRやALK阻害薬治療後の再生検ではPD-L1発現の変化が観察されており、治療歴を考慮したフレッシュな生検の実施が将来的に必要となる可能性がある。免疫療法中のPD-L1発現ダイナミクスも治療反応性予測に関わる可能性があり、動的バイオマーカーとしての評価体制構築が今後の課題である。
TIIC (tumor-infiltrating immune cell) のPD-L1発現評価: TIICのPD-L1発現は、atezolizumabの複数の試験で奏効と強く関連しており、腫瘍細胞 (TC) のみを評価する方法では予測能が不十分となる可能性がある (Figure 3)。樹状細胞 (DCs)、マクロファージ、リンパ球 (B細胞、T細胞、NK細胞) など、多様な免疫細胞種の認識と判別は、小検体や細胞が分離された組織構造では困難である。このため、TC0/IC1-3 (immune cell score categories 1-3) などの複合スコアリングシステムが複数の試験で採用されている。マルチプレックス蛍光法および自動画像解析による細胞種別評価技術の開発が求められる。
Blueprint Project (AACR-IASLC) による抗体比較: Bristol-Myers Squibb、Merck、Genentech/Roche、AstraZenecaの製薬企業とDako、Ventanaの診断企業が協力し、同一のNSCLC検体 (n=39) を用いて4つの主要抗体 (22C3, 28-8, SP263, SP142) の比較評価を実施した (Table 2)。その結果、22C3、28-8、SP263は類似したスコアを示したが、SP142は全体的に低いスコア傾向を示した。この違いは、SP142が細胞内ドメインを認識するのに対し、他の3抗体が細胞外ドメインを認識することに起因すると推定される。事前に定義されたカットオフ値で「陽性」/「陰性」に二値化した場合、4つのアッセイすべてで同一の結果が得られたのは50% (39例中19例) のみであった。SP142を除く3つのアッセイが一致した検体は全体の約75%であった。22C3と28-8の連続スコアはPearson相関r>0.9と高い一致を示したが、SP142の腫瘍細胞スコアは他3抗体よりも平均15-20ポイント低く、カットオフ値次第で試験間の有効性データ解釈が大きく乖離することが定量的に示された。この結果はBlueprint Phase 2 (n=83) でも再現され、SP263が22C3・28-8と高い一致を示す一方でSP142が系統的に低値を示すパターンが確認された。
その他のバイオマーカー: (1) PD-L1 mRNA (in situ hybridization) はタンパク質陽性率よりも高く、IHC陰性でも陽性例が存在する。(2) 腫瘍変異量 (TMB) およびネオアンチゲン量は、pembrolizumabによるNSCLCの奏効およびPFSと有意に相関した (Rizvi et al. Science 2015; p<0.001)。喫煙歴のあるNSCLC患者は非喫煙者と比較してTMBが高く、奏効率も高い傾向にある。(3) ミスマッチ修復 (MMR) 欠損およびMSI-H (microsatellite instability-high) 腫瘍では、pembrolizumabの奏効率が40%に達し、非MSI腫瘍の0%と比較して顕著な差が見られた。(4) PD-L2 (programmed cell death ligand 2) はPD-1への親和性がPD-L1の2-6倍高いが、主に抗原提示細胞 (APC) で発現し、腫瘍細胞での発現は稀である。PD-L2の腎がん、肺多形がん、KRAS変異NSCLCにおける予後意義は現在研究中である。(5) TMBは非同義変異数 (Mut/Mb) で定量化され、喫煙歴のあるNSCLCでは中央値10-50 Mut/Mb、非喫煙者NSCLCでは3-8 Mut/Mbと大きく異なる。Rizvi et al. Science 2015のKEYNOTE-001サブセット解析 (n=34) では、TMB高値群は低値群よりもPFSが延長し (HR 0.19, p=0.001)、PD-L1 IHC陰性かつTMB高値の患者でも奏効が確認されたことから、両バイオマーカーの相補的活用が推奨された。MMR欠損によるMSI-H腫瘍では変異量が極めて高く (>100 Mut/Mb)、PD-L1発現に依存せずpembrolizumab奏効が期待できるため、MSI検査の標準化も今後の課題として位置づけられている。
考察/結論
PD-L1 IHCは肺がん免疫療法の主要な予測バイオマーカーであるが、異なる抗体クローン、IHCプラットフォーム、カットオフ値、および標的細胞 (TC vs TIIC) の組み合わせにより、結果の解釈が複雑であるという課題が残されている。Blueprint Projectのような標準化への取り組みが進行中であるが、現時点では「特定の薬剤-コンパニオン/コンプリメンタリー診断薬」の組み合わせ単位での解釈が推奨される。
先行研究との違い: 先行研究であるTopalian et al. NEnglJMed 2012やGaron et al. NEnglJMed 2015がそれぞれ独自の抗体とカットオフでPD-L1を評価した枠組みと異なり、Blueprint Projectは4社が同一NSCLC検体 (n=39) を用いた並行評価により、抗体間の一致率を定量化した新規な協調的比較基盤を提示した点で画期的である。これは将来的な多施設前向き検証の礎となる。
新規性: 本レビューは、PD-L1 IHC評価における多岐にわたる課題を包括的に整理し、特にBlueprint Projectの初期結果を詳細に分析することで、異なる抗体クローン間の発現レベルの系統的な差異を定量的に示した点で新規性がある。これにより、PD-L1バイオマーカーの標準化に向けた具体的な方向性が明確にされた。
臨床応用: 臨床応用において、PD-L1陽性率の高い患者 (特に22C3 TPS≥50%) ではpembrolizumab単剤が推奨され、中間発現の患者では化学療法併用を検討し、PD-L1陰性であってもMSI-Hや高変異量を示す患者では免疫療法を考慮するなど、患者層別化の精緻化が進んでいる。将来的には、PD-L1を他のバイオマーカー (腫瘍変異量、MHC class II発現、免疫細胞浸潤パターンなど) と組み合わせることで、より正確な奏効予測が可能となり、個別化医療の推進に貢献することが期待される。
残された課題: 残された課題としては、(1) 抗体結合ドメインと親和性の系統的比較の不足、(2) カットオフ値の再現性および感度/特異度の多施設検証の必要性、(3) 組織の固定・保管条件の標準化、(4) 化学療法や分子標的薬などの先行治療歴がPD-L1発現に与える影響の評価、(5) 腫瘍内不均一性への対処 (複数ブロック解析など)、(6) TC/TIIC識別のための多重蛍光法やAIによる精度向上、(7) 腫瘍変異量、MSI、ネオアンチゲン量、および他の免疫チェックポイントマーカー (CTLA-4, TIGIT, TIM-3, LAG-3) との組み合わせによる複合バイオマーカーの開発が挙げられる。これらの課題を解決するためのさらなる研究と国際的な協力が不可欠である。
方法
本論文はナラティブレビューとして構成され、PubMed/MEDLINE、Scopus、およびClinicalTrials.govの3つの主要データベースにおいて、1990年1月から2016年3月までの期間を対象に系統的な文献検索を実施した。検索キーワードには「PD-L1」「CD274」「lung cancer」「NSCLC」「SCLC」「immunohistochemistry」「PD-1 inhibitor」「anti-PD-L1」「checkpoint inhibitor」を用いた。非小細胞肺がん (NSCLC) および小細胞肺がん (SCLC) 患者を対象とし、PD-L1タンパク質発現をIHCまたはmRNAレベルで評価した臨床試験、観察研究、およびバイオマーカー研究を適格文献とした。症例報告、レター、会議録抄録は除外された。
異なる臨床試験間でのPD-L1評価の比較は、使用された抗体クローン (5H1、28-8、22C3、SP142、SP263、E1L3N)、IHCプラットフォーム (Dako、Ventana)、スコアリング対象細胞 (腫瘍細胞のみ vs 腫瘍浸潤免疫細胞 (TIIC) を含む)、およびカットオフ値 (1%、5%、10%、50%) に基づいて層別化された。これにより、PD-L1陽性率、感度、特異度、および試験間の一致率の変動が評価された。引用された主要な臨床試験における統計手法には、カットオフ値の選定のためのROC解析 (例: Garon et al. NEnglJMed 2015のKEYNOTE-001)、腫瘍内均一性評価のための線形回帰およびPearson相関係数 (Velchetiら)、全生存期間 (OS) および無増悪生存期間 (PFS) 解析のためのログランク検定 (CheckMate 017/057)、および多施設アッセイ一致率算出のためのCohen’s kappa係数と記述統計 (Blueprint Project) が含まれる。本レビューは、これらの多様な評価方法がPD-L1バイオマーカーの解釈に与える影響を包括的に分析した。