顕微鏡データのファイルフォーマットの標準化を目指す「OME-Zarr」の試み



この20年で、生物顕微鏡の画像フォーマットの数は160前後にまで増えました。これを、できるだけ減らしてまとめていこうとする、画像フォーマット標準化に取り組んでいるのがジェイソン・スウェドロー氏らのチームです。



How open-source software could finally get the world’s microscopes speaking the same language

https://www.nature.com/articles/d41586-023-03064-9





スウェドロー氏らは、20年にわたって画像フォーマットの標準化に取り組んでいます。スウェドロー氏と一緒にプロジェクトに携わる、ドイツ国内の顕微鏡学者と生体画像分析者のためのネットワーク・German BioImagingのシニアリサーチ管理担当役員であるジョシュ・ムーア氏は「これは我々で管理できるものだと感じています」と述べています。



スウェドロー氏らが取り組んでいるのは「OME-Zarr」と呼ばれる新たなフォーマットで、2つのプロジェクトを融合させたものです。



1つは生物顕微鏡データのオープンソース仕様を開発するためにスウェドロー氏自身が2002年に設立した「OME(Open Microsopy Environment)」。もう1つは、大規模なデータ配列をクラウドに格納し、クラウドからダウンロードする方法を最適化するための手法である「Zarr」です。





OME-Zarrは2021年、バイオイメージング用の次世代ファイルフォーマット(NGFF)として最初の仕様が提出され、2023年から、本格的に生物学者がデータを保存するためのオプションとしてローンチされました。



顕微鏡の画像データには3D位置や照明レベル、スケール、サンプルの種類、サンプルの調製方法といったメタデータがラベル付けされます。各種のメタデータが付与されることでデータ容量が大きくなることについては、ストレージ側の大容量化によってそれほど問題視されていませんが、各メーカーの画像ファイルのメタデータを読み取るためには、多くの場合、専用のソフトウェアが必要となるそうです。





このことによる苦労の例として、アイスランド大学の博士研究員になったカトリン・メラー氏がチューリッヒ大学大学院時代に経験した事例が挙げられています。メラー氏は当時、ゼブラフィッシュの脳にあるミクログリアと呼ばれる細胞を画像化していて、1回のセッションで生成される画像データは1TB級だったとのこと。このとき、メラー氏は3台の顕微鏡をテストしましたが、いずれもデータフォーマットが異なり、しかも、データの処理・分析を行うソフトと互換性のあるものは1つもなかったため、最終的に使用することにした顕微鏡のデータを手作業でTIFFファイルに変換したそうです。この変換作業は、1日かかることもあったとのこと。



また、ムーア氏の知り合いの生物学者の事例では、72時間の実験において、すべてのフレームで特定の角度を測定する必要があり、手作業でメタデータをMicrosoft Excelに記録していたそうです。





メラー氏は最終的には、処理作業を自動化するマクロを組んで変換を高速化したものの、あくまで「手元の環境で動作すればいい」というものなので一般に使えるものではなく、ソフトウェアのバージョン違いで動作しなくなる恐れがあります。ムーア氏は「バージョン管理は大きな問題です」と述べています。



特に、メーカーでも古いバージョンはサポートしていないケースがあるため、OMEプロジェクトでは、生物学者が使用している可能性がある、そしてこれまでに使用したことがあるすべてのものをサポートすることを目指しているとのこと。



研究に不正がないかを調べる研究公正局も、作業の簡潔化につながるとして顕微鏡ファイルフォーマットの標準化を歓迎しています。ただし、学術誌・Natureの調査スペシャリストであるグレタ・シャープ氏は、画像作成者がメタデータのない低品質画像を生データとして提供することがあり、メタデータの欠落はAIにより生成された画像である危険性がある一方で、時間と労力を節約しようとした結果であることもあると、難しさを指摘しています。



しかし、利点があるとわかっていても、OME-Zarr形式の採用拡大は難しいとみられています。フランシス・クリック研究所のマーティン・ジョーンズ氏は「生物学者には新たなフォーマットの扱い方を学ぶよりも先にやるべきことがたくさんあります」と語っています。また、従来の画像ファイルであれば、スプレッドシートで扱えるように変換する方法はわかっていて、変換後にピクセルサイズや強度などのデータを数値で表示できますが、Zarrファイルの場合はネストされたフォルダーが表示されるだけで何なのかがぱっとわからないとのこと。





一方で、顕微鏡ベンダーとしては、競争の結果としてフォーマットが分立するのは仕方がないと主張しています。オリンパスの顕微鏡事業を引き継いだエビデントのマティアス・ゲネンガー氏によれば、当初はOME-ZarrのようなNGFFとの互換性を構築してきたものの、メーカーが顕微鏡を改良していくにつれて、オープンなファイル形式や汎用ファイル形式では製品のパフォーマンスを最大限に発揮できなくなることがあるとのこと。



また、これまでベンダーが作り上げてきたファイルフォーマットを捨てるメリットが何もないため、もし乗り換えて欲しいのであればそれだけのメリットを示す必要があることも指摘されています。