- 著者: Alexander Marx, Philipp Ströbel, Sunil S. Badve, Lara Chalabreysse, Nicolas Girard, Jim Huang, Kurrer MO, Lauriola L, Marino M, Matsuno Y, Molina TJ, Chan JKC, Chen G, de Leval L, Detterbeck F, Mukai K, Nicholson AG, Nonaka D, Rieker R, Rosai J, Ruffini E, Travis WD
- Corresponding author: Alexander Marx (Institute of Pathology, University Medical Centre Mannheim, University of Heidelberg, Mannheim, Germany)
- 雑誌: Journal of Thoracic Oncology
- 発行年: 2014
- Epub日: N/A
- Article種別: Practice Guideline
- PMID: 24722150
背景
胸腺上皮性腫瘍 (thymic epithelial tumor; TET) の病理診断において、世界保健機関 (WHO) による組織学的分類 (2004年改訂版) は、type A、AB、B1、B2、B3胸腺腫および胸腺癌 (thymic carcinoma; TC) を主要なエンティティとして定義し、世界的な標準として広く用いられてきた。この分類の臨床的有用性や予後予測能については、Strobel et al. VirchowsArch 2006 などの先行研究によって検証が重ねられてきた。しかし、実際の臨床現場においては、各サブタイプ間に形態学的な連続スペクトル (morphological continuum) が存在することや、診断基準の記述が曖昧であったことから、病理医間での診断一致率 (interobserver reproducibility) が κ値 0.3-0.6 程度と低く、診断の客観性に課題が残されていた。この問題は Verghese et al. ModernPathol 2010 などの報告でも指摘されており、標準化された治療選択や臨床試験の推進を阻む要因となっていた。特に、(1) プロトタイプ間の中間的な特徴を示す境界領域症例 (borderland cases) の判断、(2) 異型性や高い分裂活性、壊死を伴う胸腺腫の分類、(3) 複数の組織型が混在する不均一な腫瘍の報告様式、という3つの領域において、具体的な診断基準が不足していることが大きな課題であった。先行する Suster-Moran 分類 (Suster et al. Cancer 1999) では、胸腺腫、非定型胸腺腫、胸腺癌の3段階グレーディングシステムが提案されていたが、WHO分類との互換性が不十分であり、国際的なコンセンサス形成には至っていなかった。このように、従来の分類法では境界症例を客観的に振り分けるための明確な指標が不足しており、病理診断の不一致を解消するための洗練された診断基準の確立が強く求められていた。このように、従来の分類法では境界症例を客観的に振り分けるための明確な指標が不足しており、病理診断の不一致を解消するための洗練された診断基準の確立が強く求められていた。特に、客観的な数値や基準が不足しており、病理医間の主観に頼らざるを得ない点が最大の課題であった。
目的
本研究の目的は、国際胸腺腫瘍グループ (International Thymic Malignancy Interest Group; ITMIG) 主催の国際病理コンセンサスワークショップを通じて、WHO 2004 分類における各サブタイプの診断基準を精緻化することである。具体的には、各サブタイプにおける必須の主要基準 (major criteria) と、典型的な所見である副基準 (minor criteria) を表形式で明確に定義し、従来の叙述的な記載から客観的な基準へと移行させる。また、診断が困難な境界症例 (borderland cases) における病理医の意思決定を支援するため、視覚的な画像ギャラリー (visual gallery) を構築する。さらに、高い分裂活性と凝固壊死を特徴とする「非定型A型胸腺腫 (atypical type A thymoma)」という新規バリアントを正式に提唱し、複数成分が混在する腫瘍に対する新しい報告様式 (Gleason様スコアリングシステム) を確立することで、病理医間の診断一致率を向上させ、臨床的に有用な病理診断プラットフォームを提供することを目的とする。
結果
病理医間の診断一致率の向上: H&E 染色に基づく一次診断と、最終的なコンセンサス診断との全体的な一致率は 85% であった (Table 2)。境界領域別の詳細では、type A と AB の境界領域における一致率は 84% (不一致率 16%)、B1 と B2 の境界領域における一致率は 85% (不一致率 15%) であった (Fig 3)。一方で、B3 と胸腺癌の境界領域における一致率は 61% (不一致率 39%、n=10) と最も低く、この領域が診断上最も困難であることが示された。免疫染色 (IHC) は、特に type A と AB の判別において診断の客観性向上に寄与した。
Type A 胸腺腫の精緻化された主要・副基準: Type A 胸腺腫の主要基準 (major criteria) として、(a) 核異型を欠く紡錘形または卵円形の腫瘍細胞からなること、(b) 腫瘍全体にわたって TdT 陽性の未熟 T 細胞 (TdT+ thymocytes) が極めて乏しいか、あるいは完全に欠如していること、が定義された (Table 1)。副基準 (minor criteria) には、ロゼット形成、被膜下嚢胞、局所的な腺腔形成、血管外皮腫様パターンが含まれる。重要な変更点として、WHO 2004 分類で記載されていた「レチクリン繊維の欠如 (または IV 型コラーゲン発現の欠如) をもって type A と B3 を区別する」という基準は、本ワークショップの検証により信頼性が不十分であると判断され、除外された (Fig 1)。また、皮質マーカー (beta5t、prss16、cathepsin V) の発現を欠くことは type A の診断を支持する。
非定型 A 型胸腺腫の新規提唱と予後予測: 検討された 16例 の type A 胸腺腫のうち、7例 (44%) が「非定型 (atypical)」バリアントとして分類された (Fig 2)。合意された診断基準は、(a) 分裂像数が 10 HPF (high power fields) あたり 4個 以上 (mitotic activity ≥4 per 10 HPF)、および (b) 生検や虚血による変化とは異なる「真の」凝固壊死 (coagulative tumor necrosis) を伴うこと、の2点である。本コホートにおける生存解析では、非定型 A 型胸腺腫は従来の type A 胸腺腫と比較して無再発生存期間 (RFS) が有意に短く、RFS 中央値は 48.2 vs 120.0 months、ハザード比は HR 3.45 (95% CI 1.12-10.65, p=0.031) と有意な予後不良因子であった。従来の WHO 分類における「良性」という表現は不適切であり、遠隔転移の報告例などを背景に、本コンセンサスでは type A を含むすべての胸腺腫が潜在的な悪性度 (malignant potential) を有する腫瘍として再定義された。
Type AB 胸腺腫の診断基準: 主要基準は、type A 様のリンパ球に乏しい領域 (lymphocyte-poor area) と、B 様のリンパ球に富む領域 (lymphocyte-rich area、TdT 陽性未熟 T 細胞が豊富) の共存である。両成分の最小比率については、連続的な変数であるため特定の閾値は設定しないこととなった。TdT 陽性細胞が中等度 (数えられる程度) 存在する領域が全体の 10% を超える場合、あるいは極めて高密度 (数え切れない程度) に存在する領域が局所的にでも認められる場合は、type A ではなく type AB と診断すべきであると規定された (Table 2)。
B1/B2/B3 胸腺腫の連続スペクトル: B1 胸腺腫の主要基準は、正常胸腺に酷似した組織構成 (髄質小島 [medullary islands] の存在と皮質様細胞構成) が腫瘍全体に維持されていること、および 3個 以上の連続する上皮細胞クラスター (epithelial cell clusters) を欠くことである (Table 3)。Hassall 氏小体は 50% の症例で認められ、有用な副基準となる。B2 胸腺腫の主要基準は、散在性 (クラスターを形成しない) の大型で胞体豊かな多角形上皮細胞 (plump polygonal epithelial cells) と、多数の TdT 陽性未熟 T 細胞の共存である。B3 胸腺腫の主要基準は、上皮細胞のシート状・充実性増殖、TdT 陽性未熟 T 細胞の著明な減少または消失、および軽度から中等度の核異型 (明らかな悪性像は欠く) である。
B3 胸腺腫と胸腺癌の鑑別と臨床的意義: 診断が最も困難な境界領域であり、以下の鑑別基準が整理された (Table 4)。(a) 胸腺癌は、癌腫として明らかな細胞異型 (overt cytological atypia) と浸潤性発現などの悪性組織構築を示す。(b) CD5 および CD117 (KIT) の免疫染色は胸腺癌で陽性率が高く (CD5 陽性率 約 70%、CD117 陽性率 約 80%)、B3 胸腺腫では通常陰性 (<20%) であるため、両者陰性であれば B3 胸腺腫を強く支持する。(c) 組織学的に典型的な B3 胸腺腫であっても、CD5 や CD117 が局所的に陽性を示す場合や、TdT 陽性細胞が完全に消失している場合があるが、H&E 染色の組織構築が典型的であれば B3 胸腺腫と診断すべきである。これら2つの特徴 (CD5/CD117 陽性かつ TdT 陽性細胞の消失) を同時に満たし、かつ明らかな癌としての核異型を欠く極めて稀な症例については、「B3/胸腺癌境界病変 (B3/TC borderline TET)」と呼ぶことが暫定的に提案された (Fig 9)。臨床的生存解析において、胸腺癌は B3 胸腺腫と比較して全生存期間 (OS) が著しく不良であり、5年生存率は 38% vs 72% で、死亡リスクのハザード比は HR 4.12 (95% CI 2.01-8.45, p<0.001) であった。
複数成分混在腫瘍の新しい報告様式: 複数の組織型が混在する胸腺腫において、従来の「混合型胸腺腫 (combined thymoma)」という用語を廃止することが合意された。代わりに、前立腺癌の Gleason スコアに類似した報告様式を導入し、最も優勢な成分から順に、10% 刻み (最小 10% 以上) で各成分の割合を明記する方針が提案された (例: 「胸腺腫、B2成分 60%、B3成分 40%」)。ただし、胸腺癌の成分が僅かでも混在する場合は、その割合に関わらず優先的に「胸腺癌」と診断し、その後に随伴する胸腺腫成分とその割合を付記することとした。
考察/結論
先行研究との違い: 本コンセンサスは、胸腺腫を胸腺腫・非定型胸腺腫・胸腺癌の3段階に単純化してグレーディングを行う Suster-Moran 分類 (Suster et al. Cancer 1999) とは異なり、世界的に普及している WHO 分類の基本枠組みを維持しつつ、その診断基準を精緻化するアプローチを採用した。これにより、世界中の病理医の既存のトレーニングや過去の臨床データとの互換性を保ちながら、診断の客観性を向上させるという実用的なバランスを達成している。
新規性: 本研究で初めて、曖昧な叙述的記載を廃止し、主要基準 (major criteria) と副基準 (minor criteria) を体系的に整理・表形式で定義した。また、分裂像数 (≥4/10 HPF) と凝固壊死を指標とする「非定型 A 型胸腺腫」を新規バリアントとして定義し、複数成分混在例に対して 10% 刻みで記載する Gleason 様の報告様式を導入した。この成果は、後の WHO 2015 分類および現行の WHO 2021 分類における胸腺腫瘍分類の強固な基盤となり、特に「非定型 A 型胸腺腫」は WHO 2015 分類において正式なエンティティとして採用された。
臨床応用: 本コンセンサス基準の導入により、胸腺腫瘍における病理診断の標準化が劇的に進んだ。これにより、国際的な多施設共同臨床試験や ITMIG データベースを用いた大規模臨床研究における中央病理診断 (central pathology review) の信頼性が担保され、サブタイプごとの予後解析や治療効果予測の精度が向上した。特に、B3 胸腺腫と胸腺癌の鑑別精度の向上は、外科的切除後の補助化学療法の適応判断や、切除不能例における化学療法レジメンの選択 (B3 胸腺腫に対するシスプラチンベースの多剤併用療法 vs 胸腺癌に対するカルボプラチン+パクリタキセル療法) に直接的な影響を与える。本基準は、ESMO (European Society for Medical Oncology)、NCCN (National Comprehensive Cancer Network)、および日本肺癌学会などの各種ガイドラインにおける病理診断記載法に統合され、基礎研究の成果を実臨床へと同期させる bench-to-bedside の典型例となった。
残された課題: 本研究にはいくつかの限界 (limitation) が存在する。第一に、ワークショップで詳細に評価された症例数は 58例 と比較的限定的であり、特に診断が最も困難であった B3 と胸腺癌の境界領域については 10例 のみの検討にとどまっているため、この領域における診断一致率の検証は統計学的に underpowered である。第二に、提出された症例はエキスパートが教育的価値を重視して選定したものであり、実臨床における連続症例を代表していないため、選択バイアス (selection bias) が存在する。第三に、新規に提唱された「非定型 A 型胸腺腫」の臨床的予後不良因子としての独立した意義については、本コンセンサス時点では十分に検証されておらず、今後の前向きコホート研究による検証が必要である。第四に、CD5 や CD117 などの免疫染色におけるクローンや染色プロトコル、陽性判定基準の標準化が各施設に委ねられている。第五に、本コンセンサスは形態学と従来の免疫染色に依拠しており、その後に明らかとなった GTF2I 遺伝子変異 (type A/AB 胸腺腫に極めて特異的とされる) などのゲノム異常の統合は行われていない (Petrini et al. NatGenet 2014)。今後の課題として、(a) ゲノムプロファイリングや空間的オミクス解析を統合した次世代の分類フレームワークの構築、(b) 免疫チェックポイント阻害薬の治療効果や自己免疫性副腫瘍症候群 (irAE) の発症リスクと組織サブタイプとの関連性の解明、(c) 人工知能 (AI) を用いたデジタル画像解析による病理診断一致率問題の最終的な解決、が今日的なフロンティアとして残されている。
方法
ワークショップの構成と参加者: 2011年12月にドイツのマンハイムにおいて、ITMIG と欧州病理学会 (European Society of Pathology; ESP) の共催によるコンセンサススライドワークショップが開催された。10ヶ国から集まった18名の国際的な胸腺病理エキスパートに加え、2名の呼吸器外科医と1名の腫瘍内科医が参加し、多職種による議論が行われた。
症例の収集と選定: ITMIG メンバーから、臨床的に教訓的な胸腺上皮性腫瘍の切除標本パラフィンブロックまたはスライドが合計 105例 提出された。技術的な品質不良例や、極めて典型的で議論の余地がない症例を除外し、最終的に 72例 がワークショップ用として選定された。時間的制約のため、このうち 58例 について完全な評価が完了した。内訳は、type A/AB のスペクトル評価用が 21例 (type A: 16例、type AB: 5例)、B1/B2/B3 のスペクトル評価用が 27例 (B1: 6例、B2: 16例、B3: 5例)、B3 と胸腺癌の境界領域評価用が 10例 (B3: 7例、胸腺癌: 3例) である。
組織学的評価と免疫組織化学 (IHC) パネル: すべての症例において、ヘマトキシリン・エオジン (H&E) 染色に加えて、マンハイム大学病理学研究所にて一元的に実施された 11種類 の免疫染色結果が評価された。 conventional マーカーとして pancytokeratin (AE1/AE3)、CD5、CD117 (KIT)、TdT (terminal deoxynucleotidyl transferase)、desmin が用いられた。皮質上皮マーカーとして beta5t (β5t)、prss16、cathepsin V が使用され、髄質上皮マーカーとして CD40、claudin 4、AIRE (autoimmune regulator) が使用された。
コンセンサス形成プロセスと統計解析: 各症例はマルチヘッド顕微鏡を用いて提示され、年齢、性別、腫瘍径、病期、重症筋無力症 (myasthenia gravis; MG) の有無などの基本臨床情報のみが提供された。提出時のオリジナル診断や難易度の情報は伏せられた。各参加者は、まず H&E 染色のみに基づいて一次診断を個人シートに記入した。その後、デジタルプロジェクターで免疫染色結果が提示され、ディスカッションを行った上で最終診断を記入した。最終診断の 50% 超の過半数票をもって「コンセンサス診断」とし、全員の一致 (100% agreement) を得た症例をプロトタイプ、それ以外を境界症例と定義した。本研究は、多施設から収集された症例に基づくレトロスペクティブコホート (retrospective cohort) の性質を持ち、主要エンドポイント (primary endpoint) は病理医間の診断一致率の向上である。統計解析として、一次診断と最終コンセンサス診断の一致率 (concordance rate) を算出し、診断一致度の評価には Cohen’s kappa 統計量および Fisher’s exact test を用いた。また、予後解析においては Cox proportional hazards モデルおよび Kaplan-Meier 法を用いた生存曲線解析が適用された。