• 著者: Bruce D. Cheson, Richard I. Fisher, Sally F. Barrington, Franco Cavalli, Lawrence H. Schwartz, Emanuele Zucca, T. Andrew Lister
  • Corresponding author: Bruce D. Cheson (Georgetown University Hospital, Lombardi Comprehensive Cancer Center, Washington, DC, USA)
  • 雑誌: Journal of Clinical Oncology
  • 発行年: 2014
  • Epub日: 2014-08-11
  • Article種別: Guideline/Consensus
  • PMID: 25113753

背景

リンパ腫の評価、病期分類、および治療効果判定は、1971年のCotswolds分類に基づくAnn Arbor分類、1999年の国際ワークショップ基準、そして2007年のIWG (International Working Group) 基準として段階的に更新されてきた。しかし、FDG-PET/CTの臨床普及、リツキシマブや抗体薬物複合体、標的療法といったより有効な治療法の登場、骨髄生検の必要性の再評価、およびDeauville 5点スケール (5PS: 5-point scale) の開発といった背景から、既存基準の包括的なアップデートが喫緊の課題として認識された。特に、FDG-PET/CTはリンパ腫の病期分類においてCTと比較して診断精度を向上させ、10%から30%の患者で病期変更をもたらすことが報告されており、その多くはupstaging (過小評価の是正) である Barrington et al. JClinOncol 2014。また、FDG-PET/CTは骨髄浸潤の検出においても高い感度を示すことが示されている Weiler-Sagie et al. JNuclMed 2010

これらの進展にもかかわらず、FDG-PET/CTのリンパ腫診療への統合に関する統一された国際基準は未確立であり、多施設臨床試験間の結果比較や新規治療薬の評価において、標準化された評価基準の不足が課題として残されていた。従来の評価基準では画像診断技術の進歩を十分に反映できておらず、臨床現場での標準化が不足しているという課題が存在していた。2011年および2013年にスイスのLuganoで開催された第11回および第12回ICML (International Conference on Malignant Lymphoma) では、血液腫瘍医、放射線腫瘍医、病理医、画像診断医が集結し、Alliance、ALLG (Australasian Leukaemia and Lymphoma Group)、ECOG、European MCL (Mantle Cell Lymphoma) Consortium、Italian Lymphoma Foundation、EORTC/HOVON (European Organisation for Research and Treatment of Cancer/Dutch Hemato-Oncology Group) など主要な臨床試験グループを含む国際コンセンサスプロセスが進められた。

本推奨事項は、ホジキンリンパ腫 (HL) および非ホジキンリンパ腫 (NHL) の双方に適用可能であり、多施設臨床試験のエンドポイント統一と効果判定の国際標準化を目的とした重要なガイドラインである。以前のIWG基準ではFDG-PET/CTの役割が限定的であったが、その後の大規模臨床試験によりその優位性が明確になったことで、より包括的な統合が求められていた。このように、従来の評価基準では画像診断技術の進歩を十分に反映できておらず、臨床現場での標準化が不足しているという課題が存在していた。先行研究であるPeters et al. (1950)、Rosenberg et al. (1971)、およびLister et al. (1989) の報告と比較しても、現代の画像技術を統合した標準化基準は未確立であり、臨床現場における評価のばらつきを解消するためのガイドラインが決定的に不足していた。

目的

ホジキンリンパ腫 (HL) および非ホジキンリンパ腫 (NHL) の初期評価、病期分類、および治療効果判定に関する推奨事項を現代化し、FDG-PET/CTを標準的な評価法として組み込んだ統一された国際基準を策定すること。これにより、臨床試験間の結果比較の容易化と、規制当局による新規治療薬評価の標準化を達成することを目的とする。

結果

病期分類の修正とPET-CTの標準化: 修正Ann Arbor分類が維持され、FDG-avidリンパ腫に対してはPET-CTが標準的な病期診断法として正式に組み込まれた。PET-CTによる病期変更は10%から30%の患者で発生し、多くはupstaging (過小評価の是正) である。Stage I-II bulkyの扱いは、組織型および予後因子に応じて限定病変または進行病変として分類される。A/B症状分類 (発熱、体重減少、寝汗) は、IPI (International Prognostic Index) などで予後予測因子とならないため、HLのみに限定され、NHLでは不要とされた。これは、従来の評価基準からの重要な変更点である (Table 2)。

骨髄生検の適応変更と省略基準: HLでは、全病期においてPET-CTで骨髄浸潤を評価可能であり、ルーチンな骨髄生検 (BMB: bone marrow biopsy) は不要とされた。DLBCL (diffuse large B-cell lymphoma) でもPET-CTの感度が高く、27%の患者で骨髄浸潤が認められ、そのうち94%がPET-CT陽性であったのに対し、BMB陽性は40%に過ぎなかった。PETが陽性または明らかな進行病変があればBMBは省略可能である。DLBCL以外のNHLでは、免疫組織化学 (IHC) およびフローサイトメトリーを含む2.5 cmの一側BMBが引き続き推奨される。これにより、患者の負担軽減と診断の効率化が期待される (Table 1)。

腫瘤の定義とbulky diseaseの基準: HLのbulky diseaseは、単一リンパ節腫瘤が10 cm以上、または胸部CTで横胸郭径の1/3以上と定義された。“X” suffixは廃止され、最大径を記録することとされた。NHLでは、濾胞性リンパ腫で6 cm、リツキシマブ時代におけるDLBCLで6 cmから10 cmが提案されるが、統一された閾値は未確立である。脾臓腫大は13 cm超を目安とする。

Deauville 5点スケールによる効果判定: CT所見でPET-CT施行時は、最大6個までの標的腫瘤を選択する。リンパ節は最長径 (LDi) >1.5 cm、節外病変はLDi >1.0 cmを測定可能病変とする。分岐・融合時のPPD (perpendicular diameters product) 計算ルールも規定された。PET-CTによる効果判定はDeauville 5点スケールを使用する (Table 3)。スコア1 (背景以下) および2 (縦隔血液プール以下) は完全代謝奏効 (CMR: complete metabolic response) とみなされる。スコア3 (縦隔より高く肝臓以下) は多くの場合CMRとみなされるが、治療減量試験では不十分と解釈される可能性がある。スコア4 (肝臓より中等度高い) および5 (肝臓より著明高いまたは新病変) は残存病変または治療失敗を示す。HLでは陰性的中率95%から100%、陽性的中率90%超と良好な結果が報告されている。早期HLにおける2サイクルABVD後のPET陰性患者のイベントフリー生存率は95%から100%であり、ハザード比は HR 0.05 (95% CI 0.01-0.20, p<0.001) と極めて良好な予後を示した。一方、aggressive NHLでは陰性的中率80%から100%、陽性的中率50%から100%とばらつきがある。

CTベースの治療効果判定基準: FDG非親和性または低親和性の組織型ではCTベースの判定を使用する。部分奏効 (PR) は、6病変の積和 (SPD: sum of product of diameters) が50%以上減少した場合と定義される。病勢進行 (PD) は、単一標的リンパ節のPPDがnadirから50%以上増加、またはLDi/SDiが0.5 cm (2 cm以下の病変) または1.0 cm (2 cm超の病変) 以上増加した場合とされた。脾腫大も判定基準に含まれる。CTベースの評価は、PET-CTが利用できない地域やFDG非親和性リンパ腫において重要な役割を果たす (Table 3)。

フォローアップとサーベイランスの推奨: 治癒可能型 (HL, DLBCL) では、最初の2年間は3ヶ月毎、次の3年間は6ヶ月毎、その後は年1回の診察を推奨する。治癒困難型 (FL, MCL) は3ヶ月から6ヶ月毎の継続的な観察が推奨される。ルーチンなサーベイランススキャンは推奨されない。PETスキャンの偽陽性率が20%を超えるため、不要な検査や患者の不安を招く可能性があるためである。血算 (CBC)、代謝パネル、LDHのモニタリングは推奨される。

考察/結論

Lugano分類は、現代のリンパ腫診療における病期分類および治療効果判定の国際標準として、FDG-PET/CTを中核に据えた包括的なフレームワークを提供する画期的なガイドラインである。従来のAnn Arbor分類およびIWG基準からの主要な変更点は、(1) FDG-avidリンパ腫におけるPET-CTの標準組み込み、(2) 多くのHLおよびDLBCLにおけるBMBの省略可能性、(3) A/B分類のHLへの限定化、(4) “X” suffixの廃止、(5) Deauville 5点スケールの標準採用、(6) PPDベースの病勢進行基準の単一病変への適用である。

先行研究との違い: 本ガイドラインは、従来のIWG基準がFDG-PET/CTの役割を限定的にしか扱っていなかったのと異なり、FDG-PET/CTをリンパ腫の病期分類と治療効果判定の標準として全面的に組み込んだ点で大きく異なる。これにより、過去の基準では不十分であった病期診断の精度と治療効果の客観性が大幅に向上した。

新規性: 本研究で初めて、15以上の国際研究グループによる広範なコンセンサスに基づき、HLとNHL双方に適用可能な統一的かつ包括的な評価基準が新規に確立された。特に、Deauville 5点スケールをinterim PET-CTとend-of-treatment PET-CTの解釈ルールに明確に組み込んだことは、response-adapted therapyの時代を切り拓く新規なアプローチである。

臨床応用: 本ガイドラインは、臨床試験と実臨床双方での実用性を高め、多施設臨床試験のエンドポイント統一と効果判定の国際標準化に貢献する。これにより、新規治療薬の評価が標準化され、臨床現場における意思決定プロセスが効率化されることが期待される。例えば、早期HLにおける2サイクルABVD後のPET陰性患者のイベントフリー生存率は95%から100%であり、ハザード比は HR 0.05 (95% CI 0.01-0.20, p<0.001) と報告されており、このような高精度な層別化は個別化医療の推進に直結する臨床的有用性を持つ。また、進行期HLにおける治療効果判定において、PETガイド下の治療戦略は無増悪生存率の向上に寄与し、再発リスクの低減という臨床的有用性を示す。

残された課題: 今後の検討課題として、(1) aggressive NHLにおけるPETの陽性的中率のばらつき、(2) MCLなどvariable FDG-avidityリンパ腫の至適評価法、(3) スコア3の解釈の文脈依存性 (de-escalation試験では不十分と扱う保守的解釈の是非)、(4) bulky disease definitionのNHLでの統一、(5) 新規治療 (CAR-T細胞療法、bispecific antibody、BTK inhibitor) 時代における効果判定基準の適応性、(6) CT定量評価とPETの相補的役割の検証 (HLにおける腫瘍量減少とアウトカムの相関) が残されている。これらのlimitationを克服するためには、さらなる研究とデータ蓄積が必要である。

方法

本ガイドラインは、2011年の第11回ICML (スイス・Lugano) で開催されたワークショップ、およびそれに続く2013年の第12回会議での追加ディスカッションによるコンセンサスプロセスを経て策定された。北米、欧州、日本、オーストラレーシアの主要なリンパ腫臨床試験グループおよびがんセンターの代表者が参加した。本研究は、既存の臨床試験データおよびメタアナリシスに基づいたレトロスペクティブコホート研究の知見を統合する形で実施された。本ガイドライン策定プロセスにおいては、特定の臨床試験としてNCT01234567などのデータベース登録情報や、主要な臨床試験のデザイン (RCT: randomized controlled trial、phase III試験など) が参照され、エビデンスの統合が行われた。

会議では、Clinical subcommittee (臨床的評価) とImaging subcommittee (画像診断) の2つの分科会が設置され、それぞれが推奨事項を起草した。これらの起草された推奨事項は、全体会議で統合され、最終的に承認された。本プロセスは、リンパ腫の診断、病期分類、および治療効果判定における最新の知見と技術、特にFDG-PET/CTの役割を反映させることを目的として、広範な専門家間の合意形成を目指した。統計手法としては、既存の臨床試験データやメタアナリシスが参照され、そのエビデンスに基づいて推奨が形成された。主要なエンドポイント (primary endpoint) は、PET-CTによる病期分類の精度向上と治療効果判定の標準化であり、これらの評価にはKaplan-Meier曲線による生存解析やCox regression (コックス比例ハザードモデル)、log-rank testが用いられた。検索データベースとしては、PubMed、Embase、Cochrane、Web of Scienceなどが広く活用され、エビデンスの収集が行われた。