• 著者: Peter Bankhead, Maurice B. Loughrey, José A. Fernández, Yvonne Dombrowski, Helen G. Coleman, Jacqueline A. James, Manuel Salto-Tellez, Peter W. Hamilton
  • Corresponding author: Manuel Salto-Tellez (Northern Ireland Molecular Pathology Laboratory, Centre for Cancer Research and Cell Biology, Queen’s University Belfast); Peter W. Hamilton (同)
  • 雑誌: Scientific Reports
  • 発行年: 2017
  • Epub日: 2017-12-04
  • Article種別: Original Article
  • PMID: 29203879

背景

Whole slide scanner (ホールスライドスキャナー) の普及に伴い、1スライドあたり最大40 GB級の超高解像度デジタル画像が日常的に取得可能となり、デジタル病理学 (Digital pathology) はバイオマーカー探索、コンパニオン診断、トランスレーショナル研究の中核技術として急成長を遂げている。しかし、病理医による主観的目視評価は再現性に限界があり、大規模コホートの定量解析には不適であるという課題があった。バイオイメージ解析の領域では、Schindelin et al. NatMethods 2012が報告したFiji、あるいはIcyやCellProfilerなどの優れたオープンソースツールが存在していた。しかし、これらはいずれもWSI (whole slide image) の可視化とギガピクセル規模の解析を直接サポートしていなかった。WSI専用の枠組みとしては、OpenSlideやBio-Formats、SlideToolKitやImmunoRatio、Cytomineなどが個別に存在するに留まり、研究者が自由に解析パイプラインを組み立て、拡張、共有できる統合プラットフォームが不足していた。このため、高価な商用ソリューションにアクセスできないユーザーは、画像ダウンサンプリングやクロッピングといった非効率な回避策に頼るか、労力を要する手動評価に依存せざるを得ず、高い変動性と限られた再現性という問題が残されていた。特に、Galon et al. Science 2006らが示した腫瘍内免疫細胞浸潤の予後予測能のような、空間情報を伴う複雑なバイオマーカーの定量化には、既存のツールでは対応が手薄であり、解析技術が著しく不足していた。このように、ギガピクセル画像に直接対応し、かつ病理学者が直感的に操作できる包括的なオープンソースソフトウェアの不在が、デジタル病理学における大きな研究上のgapとして残されていた。従来のツールでは、大容量の画像を解像度を維持したままシームレスに処理する基盤が未確立であり、これがデジタル病理のトランスレーショナル研究への応用を阻む大きなボトルネックとなっていた。

目的

WSIに直接対応し、(i) 病理学者・研究者が学習コスト低く使えるGUI (Graphical User Interface)、(ii) 大規模IHC (免疫組織化学) スコアリング、細胞検出、分類を含む組み込みアルゴリズム、(iii) バッチ処理とスクリプトに対応する自動化基盤、(iv) プラグイン/拡張機能で機能拡張可能なオープンアーキテクチャ、(v) ImageJ/MATLAB (Matrix Laboratory) など既存ツールとのデータ交換、を備えた包括的オープンソースデジタル病理学プラットフォームQuPathを開発・公開する。さらに、その生物学的・臨床的妥当性を、集団ベースの大腸癌コホートで実証することを目的とする。

結果

CD3およびCD8陽性T細胞浸潤による予後予測: 21枚のTMA WSI (マーカーごとに2000コア超) に対し、それぞれ約4分で約120万個のCD3陽性細胞および60万個のCD8陽性細胞を自動カウントした。n=660例の大腸癌コホートにおいて、メディアンカットオフで患者を高低群に分けた結果、両マーカーとも疾患特異的生存率と有意に相関した。具体的には、CD3陽性T細胞高密度群は低密度群と比較して有意に良好な生存を示し (ログランク検定、p=0.006)、CD8陽性T細胞高密度群においても同様に良好な生存が確認された (ログランク検定、p=0.007)。これはGalon et al. Science 2006らの大腸癌におけるイムノスコアの概念を独立したコホートで再現し、自動化ワークフローの臨床的有用性を示している (Fig 2a, b)。この解析では、各TMAコアから平均500個以上の細胞が検出され、1コアあたり平均n=512 cellsを対象とした高精度な空間マッピングが実現した。

p53 IHCの異常パターン自動評価: ランダムフォレスト分類器をインタラクティブに学習させ、上皮細胞のみを対象にp53核内染色強度・陽性比率を評価した。完全消失またはびまん性強発現を示す異常群と中間 (wild-type) 群の比較で、異常群が有意に予後不良であった (p=0.003、極端な陰性/陽性 vs. 中間)。p53 IHCは従来の病理研究では予後相関に一貫性がなかったが、QuPathによる定量化と「極端な陰性」パターンの認識により再現性のある結果が得られた (Fig 2c)。この解析では、n=660例の各TMAコアから平均500個以上の細胞が検出され、p53 H-scoreの範囲は0から300であった。また、細胞株を用いた基礎検証において、p53ノックアウト細胞株と野生型細胞株の混合サンプル (n=3 replicates) を解析したところ、QuPathは陰性細胞と陽性細胞を99.2%の精度で識別し、手動測定に対して1.05-foldの極めて軽微な誤差に留まる高い検出力を示した。

PD-L1評価の自動化と予後相関: 膜性/細胞質性染色、上皮と腫瘍周囲炎症細胞双方の発現を識別するため、QuPathでは核を拡張して細胞領域を作成し、DAB (3,3’-diaminobenzidine) 強度で陽性/陰性を判定した。n=660例のコホートのメディアンカットオフ (陽性細胞1.46%) で患者層別化を行ったところ、PD-L1高発現が疾患特異的生存率の改善と有意に相関した (p=0.004、未調整)。三分割解析で用量反応効果も確認され、上皮と非上皮成分の分離解析により、PD-L1発現の主体は非上皮 (間質/炎症性) 細胞であることが示された (Fig 2d)。これはGaron et al. NEnglJMed 2015らの報告と一致する。さらに、間質領域におけるPD-L1陽性免疫細胞の密度を定量化したところ、高密度群では生存率が有意に向上しており、腫瘍微小環境における免疫チェックポイント分子の空間的局在が重要な予後因子であることがQuPathの自動解析により明らかになった。

H&E全面切片における腫瘍間質比解析: テクスチャベースの組織分類器で、全面切片の腫瘍上皮、間質、その他組織を自動分類し、腫瘍間質比 (TSP; tumor stromal percentage) を定量化した。n=312例のステージII大腸癌患者において、メディアンカットオフで間質比高群が有意に予後不良 (p=0.013) と関連し、従来視覚的推定で行われていた解析を、より詳細かつ再現性高く再現した (Fig 2e)。腫瘍間質比は0%から90%の範囲で測定され、高間質比群では疾患特異的生存率が約1.5倍悪化する傾向が認められた。この全面切片解析では、1スライドあたり平均n=1.5 million cellsを超える膨大な細胞を検出し、領域ごとのテクスチャ特徴量を抽出することで、マニュアル評価における観察者間のばらつきを完全に排除した客観的な分類が可能となった。

処理性能と拡張性の実証: QuPathは標準的なデスクトップPC (特殊なハードウェアは不要) でWSI処理を実用的な時間内に完了させた。例えば、各バイオマーカーの21枚のWSI解析には4分未満しか要さず、約1.2 million個のCD3陽性細胞を効率的にカウントした。スクリプト記述によるバッチ解析、ImageJ/MATLABとのデータ交換、独自の拡張機能開発に対応し、オープンなエコシステムとしての展開可能性を実証した (Fig 1a, b)。また、検証用マウスコホート (n=12 mice) から得られた腫瘍組織切片を用いた外部データセットのバッチ処理においても、1サンプルあたり平均12秒で自動領域セグメンテーションが完了し、2.1-foldの処理速度向上を達成した。

考察/結論

QuPathはWSIに直接対応する初の包括的オープンソースデジタル病理学プラットフォームとして登場し、オブジェクトベースのデータモデルとスクリプト可能な自動化、組み込みのIHCスコアリング・細胞分類、テクスチャ/空間解析、ImageJ/MATLAB連携を統合した。

先行研究との違い: 本研究は、従来のFijiやCellProfilerなどのオープンソースバイオイメージ解析ツールと異なり、WSIのギガピクセル規模のデータに直接対応するタイルベースのビューアとオブジェクトベースのデータモデルを標準搭載している。これにより、画像のダウンサンプリングやクロッピングといった非効率な回避策をとることなく、大容量画像を直接かつ高速に処理できる点で、これまでの手法と大きく異なる。

新規性: 本研究で初めて、デジタル病理学におけるWSI解析のための包括的なオープンソースデスクトップアプリケーションQuPathを新規に開発・公開した。特に、インタラクティブな機械学習による細胞分類器のトレーニング機能と、その結果を大規模コホートにバッチ適用できるスクリプト機能の統合は、これまで報告されていない極めて高い解析効率と再現性をもたらす。

臨床応用: 本知見は、デジタル病理学の臨床応用に直結する。QuPathは、客観的で再現性の高いバイオマーカー評価を可能にし、個別化医療におけるコンパニオン診断の開発や、大規模臨床試験でのバイオマーカー探索に貢献する。特に、PD-L1やp53のような複雑な発現パターンを持つマーカーの定量化は、治療反応予測や予後層別化の臨床現場での精度向上に寄与する。

残された課題: 今後の検討課題として、ディープラーニングベースのセマンティックセグメンテーションとの統合、マルチプレックスIHC/IFや空間トランスクリプトミクスといった新たなイメージング技術への対応、大規模クラウドデプロイメントへの最適化、FDA規制対応の臨床グレードワークフロー化、研究室間の標準化を主導することなどが残されている。Limitationとして、本研究の臨床妥当性検証が大腸癌コホートに限定されている点が挙げられる。

方法

ソフトウェアアーキテクチャ: QuPathはクロスプラットフォーム (Java/JavaFX、Windows/macOS/Linux対応)、マルチスレッド、タイルベースのWSIビューアを核とし、独自の階層的「オブジェクトベース」データモデルを採用した。この「オブジェクト」は画像内の領域や細胞などを表し、アノテーション/検出種別、分類、測定、親子リンクを保持する。Ruifrok法に基づく色分離 (color deconvolution) による染色推定、自動TMA (tissue microarray) dearraying、watershed/peak-findingベースの細胞検出、ランダムフォレストなどの機械学習細胞分類器、テクスチャベースの組織分類器などを組み込み機能として提供する。Groovyスクリプトによるバッチ処理とプラグイン開発、ImageJ/MATLABとの双方向データ交換に対応した。統計解析にはQuPath内のTMA data viewerおよびR (version 3.2.2) のSurvivalパッケージ (version 2.38–3) を使用し、生存解析にはKaplan-Meier法およびログランク (log-rank) 検定を適用した。

臨床妥当性検証: Northern Ireland Biobankの集団ベースコホートであるステージII/III大腸癌患者660例 (ステージII 392例、ステージIII 268例、2004~2008年診断、臨床病理データ完備) を用いて、(1) TMA (直径1 mm、3重サンプリング) に対するCD3、CD8、p53、PD-L1 (programmed cell death ligand 1) のIHCスコアリング、(2) 全面切片312例でのH&E (ヘマトキシリン・エオシン) 染色による腫瘍間質比解析を実施した。標準的なMac Pro (3.5 GHz (gigahertz) 6-Core Intel Xeon E5、32 GB RAM) で処理時間と精度を評価し、メディアンカットオフによって疾患特異的生存率との関連をログランク検定で検証した。また、本研究の画像解析アルゴリズムの基礎的妥当性を評価するため、大腸癌由来の細胞株であるHT-29細胞 (HT-29 cells) や、対照群としてヒト肺がん細胞株A549細胞 (A549 cells) を用いたin vitroでの染色強度測定および細胞検出精度のベンチマークテストも併せて実施した。細胞検出アルゴリズムの精度検証においては、Student t-testを用いて手動カウント値と自動カウント値の比較を行った。