Performance Status in Cancer: Not Broken, But Time for an Upgrade?

著者: Jessica M. Scott, Guro Stene, Elisabeth Edvardsen, Lee W. Jones
Corresponding author: Jessica M. Scott (Memorial Sloan Kettering Cancer Center, New York, NY)
雑誌: Journal of Clinical Oncology
発行年: 2020
Epub日: 2020-06-25
Article種別: Commentary
PMID: 32584631

背景

過去70年間の早期発見技術と多剤併用療法の進歩により、がん特異的生存率は大幅に改善した。米国では現在約1,700万人ががんサバイバーとして生活しており、この数は2040年までに2,600万人に達すると予測されている (Jemal et al. 2017)。このような医療の進歩と莫大な財政的投資にもかかわらず (Mariotto et al. 2011, Wouters et al. 2020)、治療選択、毒性モニタリング、および臨床試験適格性評価の必須ツールとして用いられるパフォーマンスステータス (PS) 評価は、1948年のKarnofskyによる導入以来、本質的に変化していない (Karnofsky et al. 1948)。Karnofsky Performance Status (KPS) は1948年にKarnofskyらによって窒素マスタードの肺がんに対する有効性を評価するために開発され、患者の日常生活活動への参加能力を医師が評価する0から100までの10点刻みのスケールである。その後、1960年にはZubrodらによって、より簡潔な6段階のEastern Cooperative Oncology Group (ECOG) PSスケール (0: 完全活動的〜5: 死亡) が導入された (Zubrod et al. 1960)。これらの臨床医が評価するスケールは、当初は治療効果の評価に主に使用されていたが、1973年にZelenがPSを考慮しない臨床試験では「非常に多くの変動性とバイアスが導入され、治療間の真の差が見過ごされる可能性が高い」と指摘したことを契機に (Zelen 1973)、臨床試験の適格性基準 (KPS ≥ 60またはECOG ≤ 2が不適格) および層別化因子として中心的な役割を担うようになった (Selawry 1973, Stanley 1980, Vincent et al. 1975)。

KPSおよびECOGスケールは、数多くの腫瘍集団において臨床アウトカムの強力な独立予測因子として機能し (West et al. 2015, Cheng et al. 2017, Renfro et al. 2017)、安価で実施が容易であるという利点から、現代の腫瘍学のほぼ全ての臨床現場で不可欠なツールとして組み込まれている。しかし、現代の腫瘍学の複雑性と個別化医療の時代において、1940年代から1960年代に設計されたこれらのPS指標の有用性と限界を批判的に再評価する必要性が高まっている。特に、これらの主観的かつ静的な評価法では、患者の機能状態の微妙な変化や、現代の治療レジメンにおける毒性プロファイルの進化に対応できないという知識ギャップが残されている。従来のPS評価では、患者と医師の間で機能障害の認識に大きな乖離があり、患者が報告する機能障害の最大50%を医師が見落とすことが報告されている (Fromme et al. 2004)。また、良好なPSを持つ患者間での予後予測能が不足していることも指摘されており (Cheng et al. 2017)、より客観的で動的な評価法の開発が手薄である。

目的

本解説の目的は、腫瘍学におけるパフォーマンスステータス (PS) 評価、特にKarnofsky Performance Status (KPS) およびEastern Cooperative Oncology Group (ECOG) PSスケールの歴史的概観と批判的評価を提供することである。さらに、これらの既存スケールの限界を詳細に分析し、身体機能テスト、心肺体力 (CRF) 測定、ウェアラブルデバイスを用いたデジタルフェノタイピングといった代替的または補完的なアプローチが、がん患者の予後予測、リスク層別化、治療選択、および毒性モニタリングをどのように改善する可能性を秘めているかについて議論することを目的とする。最終的に、現代の個別化医療の文脈において、より客観的で動的なPS評価ツールの必要性を強調し、その将来的な展望を提示する。

結果

KPS・ECOGの現状と利点: Karnofsky Performance Status (KPS) およびEastern Cooperative Oncology Group (ECOG) PSスケールは、1948年および1960年の導入以来、現在も実質上全ての臨床場面で使用されている。これらのスケールは、多数の腫瘍集団において臨床アウトカムの強力な独立予測因子であり、安価で実施が容易であるという利点を持つ。例えば、KPSは0（死亡）から100（良好な機能）まで10点刻みで評価され、ECOGは0（完全活動的）から5（死亡）までの6段階で評価される。

KPS・ECOGの主観性と信頼性の問題: KPSおよびECOGスケールは臨床医による評価に基づくため主観的であり、信頼性と妥当性に問題がある。15件の研究、n=2,808例の患者を対象としたメタアナリシスでは、KPS/ECOGスコアに関する臨床医間の一致度はPearson相関係数0.71〜0.78と中程度にとどまった (Chow et al. 2020)。さらに、患者と臨床医のPSスコアの一致率は低く (Basch et al. 2016)、臨床医は患者が報告する機能障害の最大50%を見落とすことが報告されている (Fromme et al. 2004)。また、KPS < 60へのPS悪化は、患者が臨床医よりも約15ヶ月早く検出することが示された (Basch et al. 2009)。この誤分類は、臨床試験の適格性や最適な治療計画に影響を与える可能性がある。

良好PS患者における予後予測能の不足: KPSおよびECOGスコアが不良な患者では強力な予後予測因子となるが、良好なPSを持つ患者における予後予測価値は限定的である。66件のPhase IIおよびIIIランダム化比較試験 (n=44,511例、ECOG 0-2) のメタアナリシスでは、ECOGスコアが0、1、または2の患者間で臨床アウトカムに差がないことが判明した (Cheng et al. 2017)。これは、明らかな身体的障害がない患者において、ECOGが実質的に追加の予後情報を提供しないことを示唆している。

現代の治療における毒性予測への限定的な有用性: PSスケールを用いた毒性リスク予測は、PS不良患者 (KPS ≤ 60; ECOG ≥ 2) における化学療法毒性の発生率が高いことを示した1980年代の研究に基づいている (Stanley 1980, Pater et al. 1982)。しかし、現代の治療レジメンの安全性プロファイルは、支持療法、低用量併用療法、分子標的薬の使用により大幅に改善されている。実際、16,233例の固形腫瘍患者を対象とした後ろ向き研究では、ECOG PS 0の患者と1-3の患者間で相対投与強度に有意な差がないことが示された (Denduluri et al. 2015)。

静的評価の限界: KPSおよびECOGスケールは、数週間から数ヶ月間隔で行われる対面診療時にのみ評価されるため、PSの「スナップショット」しか捉えられない。これにより、臨床的に重要なリアルタイムの微妙な変化を検出する能力が制限される。

代替PS評価ツールと心肺体力 (CRF) の有用性: KPS/ECOGの限界を克服するため、いくつかの代替ツールが検討されている (Table 1)。心肺体力 (CRF) は、心血管系、肺、造血系、筋骨格系が酸素を輸送および利用する統合能力の客観的評価を提供する。ゴールドスタンダードは心肺運動負荷試験 (CPET) による最大酸素摂取量 (VO2peak) の直接測定である。がん領域では、1972年にReichelが術前推定CRFが肺がん患者の術後合併症のより強力な予測因子であることを報告した (Reichel 1972)。肺がん、消化器がん、肝胆膵がん、血液悪性腫瘍における研究では、CRFが術後合併症および死亡率の独立予測因子であることが示されている (Roman et al. 2014, Marshall et al. 2019, Kumar et al. 2018, Kelsey et al. 2014)。術前CRFの層別化値は肺がんおよび結腸直腸がん (West et al. 2016) で定義されており、15 mL O2・kg⁻¹・min⁻¹未満は合併症リスクの上昇と関連し、10 mL O2・kg⁻¹・min⁻¹未満は高リスクと見なされる (American Thoracic Society 2003)。不良なCRFは、治療関連の急性および慢性晩期合併症、全死因死亡、心血管死亡、およびがん死亡の発生率上昇とも関連している (Jones et al. 2007, Groarke et al. 2020)。

デジタルフェノタイピングの可能性: 健康技術の進歩は、がんにおけるPS評価を改善する前例のない機会を提供する。加速度計などのウェアラブルデバイスは、歩数や活動量 (軽度、中等度、活発な活動の分/日) を客観的に測定する (Peddle-McIntyre et al. 2018, Lee et al. 2018)。Saint-Maurice et al. (2020) は、n=4,840人の健康な個人において、1日8,000歩以上歩くことが、1日4,000歩未満と比較して、全死因およびがん特異的死亡リスクの低下と関連することを報告した。進行がん患者 (Gresham et al. 2018) および手術を受ける患者 (Panda et al. 2019) を対象とした予備研究では、1日あたりの歩数および総活動量の低下が、それぞれ死亡リスク (HR 0.65, 95% CI 0.50-0.85, p<0.001) および術後合併症リスクの増加と関連することが示されている。多センサーシステム (心拍数、睡眠など) を統合した消費者向けデジタルモバイルデバイスの急速な普及は、深い動的フェノタイピングのユニークな機会を提供する (Evangelista et al. 2019, Veerabhadrappa et al. 2018, Torkamani et al. 2017)。Li et al. (2017) は、n=43人の個人を対象に11ヶ月間で250,000件の日常測定値を用いて、活動量に基づく個別化されたベースライン規範データを開発し、縦断データからの異常な生理学的シグナルが疾患の早期兆候を特定するために使用できることを示した。これはデジタルフェノタイピングの実現可能性を示すものである。心不全患者n=2,500人を対象とした進行中の前向きコホート研究 (ClinicalTrials.gov識別子: NCT03810638) は、患者報告アウトカム (PROs)、移動性、および電子健康記録データを組み合わせて、生活の質やその他の臨床アウトカムの変化をモニタリングするデジタルレジストリを作成する予定である。腫瘍学におけるデジタルフェノタイピングの潜在能力を実現するためには、プライバシーとセキュリティに関するポリシーの定義、検証データセットと堅牢な統計ツールの開発、および人工知能 (AI) ツールを用いたデータリポジトリの構築が課題として残されている。

考察/結論

本Commentaryは、KPSおよびECOGスケールが「壊れていない (not broken)」—すなわち、既存の予後予測能と広範な実施可能性において依然として価値がある—としながらも、現代の腫瘍学の複雑性に対応するためには「アップグレードの時 (time for an upgrade)」であると強く訴えた。

先行研究との違い: これまでのPS評価は、Karnofsky (1948) やZubrod (1960) の時代に設計された主観的かつ静的な評価法に依存してきた。本論文は、これらの古典的評価法が現代の個別化医療の文脈において抱える限界、特に良好なPSを持つ患者間での予後弁別能の不足や、現代の化学療法レジメンにおける毒性予測への不適合性を詳細に分析した点で、これまでの単なる歴史的概観とは一線を画している。

新規性: 本研究で初めて、KPS/ECOGの主観性による評価者間不一致 (Pearson相関係数0.71〜0.78)、良好PS患者における予後弁別不能 (ECOG 0-2間で臨床アウトカムに差なし)、現代化学療法毒性予測への不適 (ECOG PS 0 vs. 1-3で相対投与強度に差なし)、および静的評価の限界という4つの具体的な根拠を体系的に提示し、これらの限界を克服するための客観的・動的な代替評価法の必要性を強調した。特に、心肺体力測定やウェアラブルデバイスを用いたデジタルフェノタイピングが、治療選択、臨床試験適格性、毒性モニタリングを改善する可能性を提示した点は新規性が高い。

臨床応用: 最も将来性が高いのは、ウェアラブルデバイスを用いた「客観的・動的・多次元的」デジタルフェノタイピングである。これにより、患者のリアルタイムな活動量 (例: 1日あたりの歩数) や生理学的データ (心拍数、睡眠パターン) を継続的にモニタリングすることが可能となる。進行がん患者や手術患者において、歩数低下が死亡や術後合併症リスクと関連することが示されており、これらの客観的データは、従来のPS評価では捉えきれなかった微細な機能変化を検出し、早期介入を可能にする臨床的有用性を持つ。将来的には、患者報告アウトカム版有害事象共通用語規準 (PRO-CTCAE) や電子健康記録との統合により、包括的なPS評価プラットフォームが構築され、臨床現場での個別化された治療戦略の策定に貢献することが期待される。

残された課題: 今後の検討課題として、デジタルフェノタイピングの導入におけるプライバシー保護、データ標準化、人工知能 (AI) を用いた解析パイプラインの構築、およびランダム化比較試験 (RCT) による厳密な検証が残されている。特に、デジタルバイオマーカーがKPS/ECOGスケールを超える付加価値を提供するかどうかを評価するための、堅牢な統計ツールを用いた検証データセットの開発が必要である。また、米国食品医薬品局 (FDA) も腫瘍学におけるPS評価の標準化を優先課題として取り組んでおり (US Food and Drug Administration 2019)、規制当局との連携も重要となる。これらの課題を克服することで、70年前の医療水準で設計された評価法を現代腫瘍学の文脈で批判的に再評価し、より精密な患者管理を実現できるだろう。

方法

本論文は、腫瘍学におけるパフォーマンスステータス評価に関する文献レビューおよびコメンタリーであるため、特定の実験的または臨床的な研究方法は実施されていない。KPSおよびECOG PSスケールの歴史的背景、開発経緯、および臨床的応用について、関連する主要な文献を網羅的にレビューした。これらのスケールの限界を評価するために、信頼性、妥当性、予後予測能、および毒性予測に関する既存のメタアナリシスや大規模な後ろ向き研究のデータが分析された。

代替的なPS評価ツールについては、老年学的評価 (GA)、造血幹細胞移植特異的併存疾患指数 (HCT-CI)、Sit-to-Standテスト、Timed-Up-and-Goテスト (TUG)、Short Physical Performance Battery (SPPB)、6分間歩行テスト (6MWT)、心肺運動負荷試験 (CPET) による心肺体力 (CRF) 測定、およびウェアラブルデバイスを用いたデジタルフェノタイピングに関する文献を調査した。これらのツールの客観性、動的評価能力、および広範な実施可能性について比較検討を行った。特に、心肺体力測定に関しては、そのゴールドスタンダードであるCPETによる最大酸素摂取量 (VO2peak) の直接測定の意義と、がん患者における術後合併症および死亡リスク予測におけるその有用性が評価された。

デジタルフェノタイピングに関しては、加速度計を用いた客観的な活動量測定 (例: 歩数、活動時間) および多センサーシステム (心拍数、睡眠パターンなど) を統合したウェアラブルデバイスの応用可能性について検討した。これらの技術がリアルタイムで患者の機能状態の変化を捉え、治療選択、臨床試験適格性、および毒性モニタリングを改善する可能性について議論した。また、デジタルフェノタイピングの導入における課題として、プライバシー、データ標準化、人工知能 (AI) を用いた解析パイプラインの構築、およびランダム化比較試験 (RCT) による検証の必要性についても言及された。本解説は、既存のPS評価法の限界を指摘し、より現代的な客観的・動的評価法への「アップグレード」の必要性を提唱するものである。統計手法としては、メタアナリシスにおけるPearson相関係数や、各評価指標とアウトカムとの関連を評価するためのCox回帰分析などが用いられた研究が参照された。

Research Wiki

エクスプローラー

Performance Status in Cancer: Not Broken, But Time for an Upgrade?

背景

目的

結果

考察/結論

方法

グラフビュー

目次

バックリンク