- 著者: Sally F. Barrington, N. George Mikhaeel, Lale Kostakoglu, Michel Meignan, Martin Hutchings, Stefan P. Mueller, Lawrence H. Schwartz, Emanuele Zucca, Richard I. Fisher, Judith Trotman, Otto S. Hoekstra, Rodney J. Hicks, Michael J. O’Doherty, Roland Hustinx, Alberto Biggi, Bruce D. Cheson
- Corresponding author: Sally F. Barrington (PET Imaging Centre at St Thomas’, King’s College London, UK)
- 雑誌: Journal of Clinical Oncology
- 発行年: 2014
- Epub日: 2014-08-11
- Article種別: Consensus Development Conference / Practice Guideline
- PMID: 25113771
背景
悪性リンパ腫の病期分類と治療効果判定は、長らくAnn Arbor 分類とその改訂版であるCotswolds 基準(Lister et al. 1989, JClinOncol)を解剖学的枠組みとして発展してきた。機能画像の導入により、2007年に International Harmonisation Project (IHP) が[18F]フルオロデオキシグルコース(FDG)を用いた陽電子放出断層撮影(PET)の初の包括的ガイドラインを公表し(Juweid et al. 2007, JClinOncol; PMID 17242397)、同年に改訂された効果判定基準にPETが統合された(Cheson et al. 2007, JClinOncol; PMID 17242396)。これらは標準化に大きく貢献したが、その後数年で技術・臨床環境は急速に変化した。PET単独からPET-CTへの移行、中間PET(interim PET; iPET)を用いた治療強度調整(response-adapted therapy)試験の登場、2009年のDeauville国際ワークショップで提案された5点スケール(five-point scale; 5-PS)の普及(Meignan et al. 2009, Leuk Lymphoma; PMID 19544140)がそれである。先行研究はPET単独時代の知見に基づいており、PET-CT併用下の標準化は十分でなかった。
この急速な進歩により、2007年版IHPガイドラインと臨床実態の間には明確な知識ギャップ(gap in knowledge)が生じていた。具体的には、どの組織型でPET-CTを標準適応とするか、Deauville 5-PSの各スコアが示す臨床的意義(特に完全代謝奏効 complete metabolic response (CMR) の定義)、骨髄生検 bone marrow biopsy (BMB) のPET-CTによる代替可否、造影CT(contrast-enhanced CT; ceCT)とのプロトコル統合、ならびにDLBCLにおける最大標準化取り込み値 standardized uptake value (SUV) 変化率(ΔSUVmax)等の定量指標の位置づけについて、国際的コンセンサスが不足していた。iPETのみに基づく治療変更の是非に関するエビデンスに基づく明確な指針も手薄なままであった。
こうした課題を踏まえ、組織型別FDG親和性を統合した大規模データ(Weiler-Sagie et al. JNuclMed 2010; n=766例)などの知見も参照し、2011年の第11回ICML (International Conference on Malignant Lymphoma) でPET-CTガイドライン改訂が必要との合意に達して本コンセンサスが策定された。本論文は、Cheson et al. JClinOncol 2014(Lugano 2014分類)の画像診断部門を規定するペア論文として位置づけられている。
目的
ICML画像ワーキンググループは、FDG親和性リンパ腫におけるPET-CTの役割を再定義し、日常臨床と後期相国際試験の双方で利用可能な世界標準の指針を構築することを目的とした。具体的目標は次の4点である。(1) WHO分類に基づく組織型別FDG親和性を定量的に提示し、PET-CT実施適応を明確化すること。(2) Deauville 5-PSを用いた病期分類・中間PET・治療終了時PET-CTの視覚的評価基準を確立し、国際的な報告様式を統一すること。(3) HL・侵襲性NHLにおける骨髄生検省略基準を提示すること。(4) DLBCLにおける定量的評価(ΔSUVmax)の臨床試験および日常臨床への応用指針を提示すること。これらを通じて、エビデンスレベルに応じたType 1(現在の確立した知見)・Type 2(新興の応用)・Type 3(さらなる研究を要する領域)の3段階に分類した17項目の推奨事項(Table 1)を策定することを目指した。
結果
WHO分類に基づく組織型別FDG親和性(Table 2): 主要リンパ腫組織型のFDG親和性が、複数の先行研究を統合した総計n=2,257例のデータとして示された(Table 2)。高親和性(PET-CT標準適応)の組織型として、HL(n=489、97-100%)、DLBCL(n=446、97-100%)、FL(n=622、91-100%)、マントル細胞リンパ腫(n=83、100%)、バーキットリンパ腫(n=24、100%)、血管免疫芽球性T細胞リンパ腫(n=31、78-100%)、末梢性T細胞リンパ腫(n=93、86-98%)が確認された。一方、低親和性(PET-CTのルーチン使用は非推奨)として、粘膜関連リンパ組織 mucosa-associated lymphoid tissue (MALT) リンパ腫(n=227、54-81%)、小リンパ球性リンパ腫 SLL (small lymphocytic lymphoma, n=49、47-83%)、皮膚B細胞リンパ腫(n=2、0%)が挙げられた。原発性皮膚退形成性大細胞型T細胞リンパ腫は親和性が40-60%にとどまり、皮膚外サイトの陽性率は27%のみと低く注意を要する。本データが組織型別のPET-CT適応判断(Type 1推奨)の科学的根拠となっている(Table 2)。
Deauville 5点スケールの定義と各スコアの解釈(Type 1/2推奨): 5-PSは、初発病変部の最強集積を肝臓・縦隔血流を基準に5段階で採点する手法で、各スコアの典型例がFig A1–A5として提示された。Score 2例では残存腋窩リンパ節SUVmax 1.2(縦隔血流SUVmax 1.7)、Score 3では残存縦隔腫瘤SUVmax 1.7(肝臓SUVmax 2.2)、Score 4では残存腫瘤SUVmax 4.5(肝臓SUVmax 3.2)、Score 5では残存腫瘤SUVmax 13.0(肝臓SUVmax 2.3)と具体的数値が示された(Fig A4, Fig A5)。これを踏まえScore 4は「肝臓最大SUVmaxを超える集積」、Score 5は「肝臓背景の約2-fold〜3-fold以上、および/または新規病変」と定義された。Score 1・2はCMRを代表し、Score 3も標準治療中の患者ではCMRとみなすことが妥当である(Type 1推奨)。一方、治療終了時にScore 4または5でベースラインから集積が低下していれば部分代謝奏効を示すが残留代謝病変であり、Score 5への集積増加・Score 5での非低下・新規FDG親和性病変の出現は治療失敗または進行と判定される(Type 2推奨)。
HLにおける中間PET(iPET)の予後予測能(Table A1): HL患者を対象にn≥50例を含む8試験(n=8 trials)が系統的にまとめられた(Table A1)。Gallamini et al. 2007(n=260、IIB-IV期、主に Adriamycin bleomycin vinblastine dacarbazine (ABVD) レジメン、2サイクル後)では、iPET陰性群(n=210)の2年無増悪生存期間(progression-free survival; PFS)が96%に達したのに対し、陽性群(n=50)はわずか6%にとどまり、極めて顕著な予後格差を示した。Zinzani et al. 2012(n=304、ABVD、2サイクル後)ではI–IIA期陰性群(n=128)の9年PFS 95%(陽性群31%)、IIB-IV期陰性群(n=123)の9年PFS 89%(陽性群29%)、Biggi et al. 2013(n=260、IIB-IV期、3年評価)では陰性群(n=215)の3年PFS 95%(陽性群28%)であった。HLではiPETの陰性的中率(negative predictive value; NPV)が一貫して高く(2年PFS 90-97%)、陽性的中率(positive predictive value; PPV)は0-53%と試験間で変動した(Table A1)。なお非腫瘤形成性I-II期HL(n=96、ABVD、Barnes 2011)では治療終了時PETのほうがiPETより予後予測に優れていた。
DLBCLにおけるiPETの限界とリツキシマブ時代の変化(Table A2): 侵襲性NHL(主にDLBCL)の11試験(n=11 trials, Table A2)では、リツキシマブ非含有時代の研究(Spaepen 2002、n=70、主にCHOP、3-4サイクル後)が陰性群2年PFS 85%・陽性群0%と高い予測能を示したのに対し、R-CHOP(リツキシマブ・シクロホスファミド・ドキソルビシン・ビンクリスチン・プレドニゾン)時代の最近の試験では結果が大きく異なった。Yang et al. 2011(n=159、R-CHOP、3-4サイクル後)で陰性群3年PFS 86%・陽性群29%、Safar et al. 2012(n=112、R-CHOP/rituximab Adriamycin cyclophosphamide vindesine bleomycin prednisone (R-ACVBP)、2サイクル後)で陰性群3年PFS 84%・陽性群47%と、陰性群NPVは維持される一方、陽性群PPVは16%(Mikhaeel 2005)から72%(Pregno 2012、n=88)まで著しく変動した(Table A2)。このPPV低下の原因として、リツキシマブによる転帰の全般的改善、あるいは免疫療法に伴う治療関連炎症由来の偽陽性代謝活性の増加が考えられる。以上から、DLBCLでは現時点でiPETの視覚的結果のみで治療変更を行うことは推奨されず(Type 1推奨)、治療終了時PET-CTが優れた予後予測ツールとなる。
治療終了時PET-CTによる寛解評価(Table A3): 治療終了時PET-CTの精度が9試験で系統的に評価された(Table A3)。HLでは高精度が確認され、Engert et al. 2012(n=739、IIB-IV期、bleomycin etoposide Adriamycin cyclophosphamide Oncovin procarbazine prednisone (BEACOPP)、5年評価)でPET陰性群(n=548)の5年PFS 92%・NPV 95%、Barnes et al. 2011(n=96、非腫瘤形成性I-II期、4年評価)で陰性群PFS 94%・NPV 94%・PPV 46%(陽性群54%)を示した。侵襲性NHLではn≥300例を含む試験でNPV 80-100%が一貫して確認されたが、PPVは50-100%と変動が大きかった。DLBCLではMicallef 2011(n=69)でNPV 90%・PPV 50%(陰性群2年PFS 78%、陽性群50%)、Pregno et al. 2012(n=88)でNPV 100%・PPV 82%(陰性群83%、陽性群64%)が報告された。高腫瘍負荷FLではTrotman et al. 2011(n=122、3.5年評価)で陰性群PFS 71%・陽性群33%、Dupuis et al. 2012(n=106、2年評価)で陰性群87%・陽性群51%が示された(Table A3)。残留病変が代謝活性を伴い救済療法(salvage therapy)を検討する場合は生検が推奨される(Type 1推奨)。
病期分類でのアップステージングと骨髄生検省略(Table 3): PET-CTはCT単独より病期分類が正確で、特に節外病変の感度が高い。CTとの比較18試験(1998-2013年、Table 3)では、ダウンステージングよりアップステージングが多く、治療方針変更はHL(n=44のBangerter 1998で14%、n=88のNaumann 2004で20%)からFL(n=17のKaram 2006で29%、n=42のWirth 2008で最大45%)まで及んだ。管理変更はCT上限局期のFLで最も多く認められた(Table 3)。また骨・骨髄・肝・脾への限局性FDG集積はHLおよび侵襲性NHLの病変検出に高感度であり、骨髄生検を省略しうる(Type 1推奨)。ただしPET-CTは骨髄の約20%未満の低容量浸潤やFL・マントル細胞リンパ腫のびまん性浸潤を見逃しうるため、これらでは生検が必要である。再発・難治HL/DLBCLでは大量化学療法・自家造血幹細胞移植(autologous stem-cell transplantation; ASCT)前のPETが予後を層別化し、陽性群の3年PFS/無イベント生存期間(event-free survival; EFS)31-41%に対し陰性群75-82%であった(Type 3推奨)。DLBCLのROC解析(receiver operating characteristic; n=92例 2サイクル後、n=80例 4サイクル後)ではΔSUVmaxの最適カットオフが時期で異なり、66-91%減と試験間で乖離した(Type 2推奨)。
考察/結論
本コンセンサスは2007年版IHPガイドラインとは異なり、PET-CT時代のリンパ腫画像診断に複数の転換をもたらした点で意義が大きい。これまでの研究ではPET単独が用いられ、効果判定の閾値(縦隔血流または隣接背景以下)が固定的でDeauville 5-PSの国際採用前であった。本研究で初めて国際コンセンサスとして確立された新規な枠組みは、(1) PET-CTを標準モダリティとして規定し、(2) Deauville 5-PSを正式な視覚的評価ツールとして採用し、(3) スコア1-3をCMRとみなすことを提案し(標準治療下でScore 3をCMRとみなす点は既報と相違する重要な変更)、(4) 骨髄生検の省略基準を提示し、(5) 22組織型・n=2,257例のFDG親和性を系統的に整理した点に集約される。
臨床応用としては、Deauville Score 1-3を達成した早期HL患者でブレオマイシン省略や放射線治療回避といった治療減弱(de-escalation)が可能となり、治療毒性の軽減に直結する。英国NCRI (National Cancer Research Institute) 主導のRAPID試験ではiPETスコア1-2の早期HL患者(3サイクルABVD後)で放射線療法省略が検討され、本基準が治療意思決定の根拠として機能した。骨髄生検省略基準の確立は患者侵襲と医療コストを削減し、PET-CTによる病期診断精度の向上(Table 3)と併せ、臨床的意義は定量的に裏づけられている。DLBCLにおけるiPETの解釈はリツキシマブ非含有(CHOP)時代と現行R-CHOP時代でPPVが著しく異なり、CHOP時代の陽性群PFS 0-43%に対しR-CHOP時代は16-72%と向上しており、従来の予測モデルが現代の免疫化学療法に適合しないことを示す点で既報と対照的である。このため本コンセンサスはDLBCLでiPET単独の治療変更を推奨せず、治療終了時PET-CTを優先する新たな方向性を提示した。
残された課題(limitation)として、第一にScore 4と5の境界(「中等度高値」「著しく高値」)の定量的定義が未確定で、肝SUVmaxを基準とした数値(Score 4:肝SUVmax超、Score 5:肝SUVmaxの約2-fold〜3-fold以上)は予備的定義にとどまる。第二にΔSUVmaxの最適カットオフが施設・時期により66-91%減と大きく乖離し、グローバルなプロトコル標準化なしには多施設適用が困難である。第三に高腫瘍負荷FL・マントル細胞リンパ腫・原発性縦隔B細胞リンパ腫・T細胞リンパ腫などHL/DLBCL/FL以外の組織型では大規模前向きデータが不足する(Cahu et al. AnnOncol 2011 や Pellegrini et al. Oncologist 2014 のように散発的報告にとどまる)。第四に造影剤使用時のFDG集積測定誤差(縦隔・肝で10-15%過大評価)が定量解析に影響しうる。これらは今後の研究(future research)と次世代のLugano分類更新に引き継ぐべき課題であり、Cheson et al. JClinOncol 2014(Lugano 2014分類)が同時発表でこれらを統合した。
方法
ICML画像ワーキンググループは、米国・英国・フランス・イタリア・ドイツ・ベルギー・スイス・デンマーク・オランダ・オーストラリアの10ヶ国から、主要国際共同研究グループを代表する核医学・放射線医学専門家16名で構成された。各専門家がPubMedを中心とした文献レビューを実施し、HL/DLBCL/FLにおけるiPETおよび治療終了時PETの予後予測能に関する主要研究(n≥50例の試験を含む)を収集・精査するとともに、進行中の多施設国際試験(RATHL (Response-Adapted Therapy in Hodgkin Lymphoma) 試験・Positron Emission Tomography-guided therapy Aggressive non-Hodgkin Lymphomas (PETAL) 試験・GAINED試験など)の最新データを参照した。本論文は新規患者データを収集する前向き試験ではなく、専門家パネルによるエビデンス統合型のガイドライン論文である。
コンセンサスは段階的に構築された。(1) 2011年第11回ICML(スイス・ルガーノ)での改訂領域の同定、(2) ドラフト策定と第4回リンパ腫PET国際ワークショップ(フランス・マントン、2012年)での発表・議論、(3) 第12回ICML(スイス・ルガーノ、2013年)での最終確認、(4) Lugano 2014分類論文との同時発表、という流れである。各推奨はType 1(確立した知見)・Type 2(新興の応用)・Type 3(要研究領域)の3段階エビデンスレベルに分類した。
統計的評価については、引用した先行試験の解析を統合する形をとった。生存比較はKaplan-Meier法によるPFS/EFS推定および群間比較(log-rank検定)が標準的に用いられ、iPETの独立予後因子性は多変量解析(multivariable analysis; Cox比例ハザード回帰)で検証されている(UK RAPID試験ではiPETが応答適応デザイン下でも3年PFSの独立予測因子であった)。ΔSUVmaxの最適カットオフ値はreceiver operating characteristic(ROC)曲線分析で導出された(n=92例 2サイクル後、n=80例 4サイクル後)。視覚的スコアリングの再現性は複数の国際施設間での評価者間一致度として検証され、HL・DLBCL・FLで良好な一致が報告された。視覚的評価ツールであるDeauville 5-PSは、Score 1(取り込みなし)、Score 2(縦隔血流以下)、Score 3(縦隔血流超〜肝臓以下)、Score 4(肝臓より中等度高値)、Score 5(肝臓の約2-fold〜3-fold以上または新規病変)、Score X(リンパ腫と無関係の可能性が高い新規集積)と規定した。