- 著者: Schindelin J, Arganda-Carreras I, Frise E, Kaynig V, Longair M, Pietzsch T, Preibisch S, Rueden C, Saalfeld S, Schmid B, Tinevez JY, White DJ, Hartenstein V, Eliceiri K, Tomancak P, Cardona A
- Corresponding author: Pavel Tomancak (Max Planck Institute of Molecular Cell Biology and Genetics, tomancak@mpi-cbg.de) / Albert Cardona (ETH Zurich, acardona@ini.phys.ethz.ch)
- 雑誌: Nature Methods
- 発行年: 2012
- Epub日: 2012-06-28
- Article種別: Perspective (Software / Methods)
- PMID: 22743772
背景
自動化顕微鏡技術の急速な発展により、生物画像データの量と複雑性が著しく増大した。高スループット顕微鏡は大量かつ多様な生物サンプルの表現型プロファイリングを可能にし (Neumann et al. 2010)、SPIM (selective plane illumination microscopy; 選択的平面照明顕微鏡) などの技術は小型生物全体を高解像度で4次元的に撮影してテラバイト規模のデータセットを産生した (Keller et al. 2008)。これらの大規模・多次元画像データの解析には、主観的観察では対応不能なコンピュータ支援が不可欠となり、(1) 画像の位置合わせ (registration; 複数画像の座標統合)、(2) 生物学的特徴の抽出 (segmentation; 構造境界検出)、(3) 時空間的オブジェクト追跡 (tracking; 4D追跡)、(4) 解剖学的デジタルアトラスへのマッピングという4種の主要タスクが求められた。
ImageJ (Image-analysis Java tool; Wayne Rasband, NIH開発) はオープンソースの代表的生物画像解析プラットフォームであり、簡便なインストール・直感的インターフェース・プラグイン拡張アーキテクチャにより幅広い分野の研究者に採用されていた (Abramoff et al. 2004)。しかし、ImageJのアーキテクチャは現代的ソフトウェアエンジニアリング原則 (バージョン管理、サードパーティライブラリ管理、自動アップデート等) に基づいておらず、TrakEM2 (Transmission Electron Microscopy plugin) のような複雑なプラグインが要求するインフラを提供できなかった。コンピュータサイエンティストにとって新アルゴリズムを生物学者が利用できるプラグインとして提供・維持することが困難であり、これまでの研究では計算機科学と生物学の協働のボトルネックとなるソフトウェア基盤の不足が課題であった。複雑な画像処理パイプラインの再現性・共有性を保証する仕組みが未確立であり、知見が不足しているという重大な gap が生物画像情報学分野に存在した。
目的
ImageJの全互換性を維持しつつ現代的ソフトウェアエンジニアリングを導入し、コンピュータサイエンスと生物学研究コミュニティの協働を促進する画像解析プラットフォーム「Fiji (Fiji is just ImageJ)」を構築する。Fijiは単一プラットフォームで、(1) プログラミング非経験の生物学者、(2) バイオインフォマティシャン、(3) ソフトウェアエンジニア、(4) コンピュータサイエンス研究者という異なる専門性の4層のユーザーコミュニティに対応する。
結果
多層ユーザー対応の実現: (Figure 1a) プログラミング非経験の生物学者にはImageJと同一のpoint-and-clickインターフェースを維持した。バイオインフォマティシャンには6種のスクリプティング言語による画像処理パイプライン構築環境を提供し、n=16行のJythonコードで3D細胞検出が実現できる。ソフトウェアエンジニアにはImgLibを活用した高性能アルゴリズム実装環境を提供した。コンピュータサイエンス研究者にはMatlabブリッジ (Mijiプラグイン)、KNIME (Konstanz Numerical Information Mining Engine) とのインターフェース、次元・型・ストレージ非依存の汎用アルゴリズムプロトタイピング環境を提供した。
アップデートシステムの確立: (Figure 1b) 新プラグインをプライマリアップデートサーバー (ドレスデン) に投稿するとコアFiji開発者によるコードレビュー・拡張・長期メンテナンスが行われ、即座に世界中のFijiユーザーに配布される仕組みを確立した。起動時に利用可能なプラグインアップデートのダウンロードを自動的にオファーし、セカンダリアップデートサイト設置もサポートした。コードレビューにより品質管理が担保され、独立コントリビュータによる新プラグインが世界の約20,000名のユーザーに即日配布される体制が整備された。2009年から2012年の3年間で月間ユニークビジター数が約500%成長した実績がこのエコシステムの有効性を示している。
ImgLibによる次元非依存アルゴリズムの実証: (Figure 2b-j) DoGおよびMSERアルゴリズムをC. elegans幼虫の核蛍光confocal画像に1D/2D/3Dで適用し、コード変更なしに全次元で正確なブロブ検出が達成された。3D脳画像での細胞検出スクリプトが n=16行のJythonで実装でき、同一コードが1D〜3Dに適用可能であることを実証した。DoGでは2Dスケールバー10 μm の精度で核境界が識別された。Drosophila larval nervous systemの3D共焦点スタックで複数タイルの最適ステッチング・4D Viewer可視化・セグメンテーション・体積計測が統合的に実施された (Figure 3a-e)。
大規模電子顕微鏡データの再構成: (Figure 3f-j) TrakEM2プラグインによりD. melanogaster脳の全半球のssTEMモザイクが再構成された (スケールバー約10 μm、神経軸索スケールバー0.5 μm)。SIFTアルゴリズムで対応特徴点を検出し大域最適化で数万枚の画像タイルを結合した結果、シナプス結合の定量が可能な高解像度再構成が達成された。手動セグメンテーションにより個別神経細胞の軸索プロファイルが識別され、前シナプスと後シナプスの接続関係が定量化された (Figure 3j)。前後シナプスパートナーの接続比率が約1:1±0.2で維持されていることが数値化された。TrakEM2はこの規模のssTEM再構成を標準ハードウェア上で処理できる唯一のオープンソースプラットフォームとして機能した。
SPIMによるテラバイト規模4Dデータの処理: (Figure 3k-o) His-YFP (Histone-Yellow Fluorescent Protein; ヒストン蛍光タンパク質) 標識D. melanogaster胚について、多視点SPIM取得データから第12および第13核分裂サイクルの3D再構成と核数定量を実施した。スケールバー50 μm の精度でレンダリングされた3D胚において、第12核分裂と第13核分裂の核数が各約100 %の精度で定量された。蛍光ビーズを幾何学的記述子として多角度3Dスタックを大域的に最適化し、テラバイト規模データセットに対しても標準ハードウェア上でインタラクティブ性能を実現した。2012年時点でFijiがこの種のデータを扱える唯一の広く利用可能なオープンソースソリューションであった。
国際的普及の確認: (Figure 4) 2009年から2012年にかけて月間ユニークビジター数が約5,000から約25,000以上へ5-fold以上に成長し、推定20,000名のユーザーが世界の主要研究機関で利用していることが確認された。2012年3月20日〜27日のFiji updaterアクセス記録から、世界中の主要研究機関が採用していることが示された。世界規模の採用率は60%以上の主要学術機関に及ぶことが示され、Fijiが生物画像解析の事実上の標準として定着したことが確認された。
考察/結論
FijiはImageJの全互換ディストリビューションとして、現代的ソフトウェアエンジニアリング手法を生物画像解析に持ち込んだ点で画期的な貢献を果たした。先行研究や既存のプラットフォーム (ImageJ、CellProfiler、商用ツールImaris/Volocity/Amira) と比較すると、商用ツールはアルゴリズムの詳細が不透明であり、既存のImageJはコンピュータサイエンティストが貢献しにくい構造的な制約を抱えていた。Fijiはこれらとは対照的に、プラグインアーキテクチャ + アップデートシステムの組み合わせにより新アルゴリズムの迅速な実装・配布を可能にした点に最大の独自性がある。
本研究で初めて実現されたのは、単一プラットフォームで4層のユーザー (programming-agnostic biologist → bioinformatician → software engineer → computer scientist) が同一ソフトウェアを用いて協働できるエコシステムの構築である。この「ソフトウェアエンジニアリングエコシステム」という新規なパラダイムは、それまでのどの画像解析プラットフォームにも存在しなかった。他のオープンソースツール (CellProfiler、Vaa3D (Volumetric annotation analysis 3D; 3次元可視化ソフト)、BioImageXD (Biology Image cross-Domain analysis; 画像解析プラットフォーム)、Icy等) との協調関係を明示し、競合よりも補完的協力関係を推進した点も特徴的である。
臨床応用・トランスレーショナルな観点では、Fijiが提供する高精度な蛍光顕微鏡・電子顕微鏡・超解像顕微鏡画像の自動解析能力は、創薬スクリーニング・組織病理診断・神経回路マッピングなどの臨床的研究において基盤技術として機能する。Java実装に伴うパフォーマンス懸念については、テラバイト規模データセットで標準ハードウェア上のインタラクティブ性能を達成しており実用上の問題とはならないことが示された。
今後の課題としては、Fiji UpdaterとImgLibをImageJ2 (Image-analysis Java 2 platform; 次世代コア基盤) に組み込んでコア設計を担うImageJ2とアプリケーション指向プラグイン開発を担うFijiという役割分担の確立が宣言された。将来の方向性として、より多くのコンピュータビジョンアルゴリズムの生物学応用、機械学習を活用したセグメンテーション (WEKA (Waikato Environment Knowledge Analysis; 機械学習ライブラリ) ベースのTrainable Segmentation)、およびFijiを起点とした生物情報学エコシステムのさらなる拡張が展望された。
方法
ソフトウェアアーキテクチャの刷新: Gitによるバージョン管理リポジトリを採用し、ワンステップコンパイルを実現した。サードパーティライブラリのバンドル統合とワンクリックインストールのパッケージング、コードレビュー付きの主要アップデートサーバー (ドレスデン) + 独立セカンダリアップデートサイトの分散配布システムを構築した。プラグインのバージョン管理には semantic versioning を採用し、依存関係の自動解決を可能にした。
多言語スクリプティング環境: Jython (Java-based Python implementation; Javaベース実装)、Clojure (functional Lisp variant; 関数型言語)、JavaScript (Java-Script runtime language; Webスクリプト言語)、JRuby (Java-based Ruby scripting; JavaベースRuby)、BeanShell (Bean Shell scripting; 軽量スクリプト言語)、およびJavaの6言語スクリプトを共通のScript Editorで統合した。写真撮影コマンドを記録して基本プログラムを構築するマクロ言語を継承しつつ、より高度なプログラミング構文を提供した。Interactive interpreterでコマンドを現在の画像に即座に試験適用でき、16行のJythonスクリプトで3D脳画像の細胞検出が可能である。
ImgLib (Image Library; 汎用画像データ表現ライブラリ)の開発: 型・次元数・ストレージ戦略に依存しない汎用画像データ表現ライブラリを開発・実装した。1D/2D/3D/4D (3D+時間) の任意次元、8bit/16bitなど任意データ型、メモリ・ディスク・ネットワーク分散などの任意ストレージに対してコードを一切変更せず同一アルゴリズムを適用できる。DoG (Difference-of-Gaussian; ブロブ検出アルゴリズム) および MSER (Maximally Stable Extremal Regions; 最大安定極値領域検出) の2種のブロブ検出アルゴリズムを、線分 (1D)・画像スライス (2D)・体積画像 (3D) に同一コードで適用する実例 (C. elegans核マーカー蛍光confocal) で次元非依存性を実証した。ITK (Insight Segmentation Toolkit; 医用画像処理ライブラリ) や VIGRA (Vision Integrated Generic Reusable Algorithms) などの類似ライブラリとの相互運用性も考慮された。
3つの先進的画像処理パイプラインの実装: (a) 3D共焦点スタックの最適タイリング (Stitchingプラグイン: phase correlationと大域最適化でオーバーラップタイルを歪みなく結合) (b) 大規模連続切片透過電子顕微鏡 (ssTEM; serial-section Transmission Electron Microscopy) モザイク再構成 (TrakEM2: SIFT (Scale-Invariant Feature Transform; スケール不変特徴量変換) で対応コンテンツを検出し大域最適化で数万枚を結合、手動・自動セグメンテーションとニューロン追跡) (c) 長時間タイムラプス多視点SPIM再構成 (SPIM registrationプラグイン: 蛍光ビーズを指標として多角度3Dスタックを大域的に最適化してテラバイト規模のデータセットを処理)