高次元点群の探索
高次元点群を探索するアプリ。
フローサイトメトリーとは何か、なぜ高次元なのか?
フローサイトメトリーは、数億個の細胞を含みうる生物学的サンプルから異なる細胞タイプを識別する強力な技術だ。以下は、細胞がどうやって高次元の点になるかを示す簡略図。

OpenLayersでギガスケール点群をナビゲートする
二次元投影で高次元データを探索する代わりに、自己組織化マップ(M. Kratochvil et al. 2020)などの次元削減手法を使えば、点群の高次元空間に埋め込まれた二次元多様体を学習し、すべての点への射影距離を最小化できる。
こうした二次元埋め込みは、異なる細胞タイプとその関係を俯瞰できるので、シングルセル系の論文では定番の図になっている。ただしデータセットが数億点に達すると、一度に全部表示しようとして図が混み合い、見づらくなってしまう。
ここでOpenLayersの出番。データセット全体を固定解像度でレンダリングする代わりに、埋め込みデータをタイル化して異なる解像度の四分木として整理する。ビューボックスの範囲とズームレベルに応じて必要なタイルだけをレンダリングする仕組みだ。地球全体の衛星画像をナビゲートするのと同じアルゴリズムで、数百GBのデータをメモリに載せる必要がない。
さらにD3.jsを使えば、静的な図のパネルに収まっていたようなインタラクティブ機能をこの可視化に追加できる。下の図では、各点をその細胞の蛍光測定値で色分けして、埋め込み内のクラスターが何を意味するかを特定している。
この機能やその他のデータ探索機能はFlowAtlas.jlで使える。
参考文献
V. Coppard, G. Szep et al. 2023. FlowAtlas.jl: an interactive tool bridging FlowJo with computational tools in Julia. bioRxiv, 2023.12.21.572741
MetaCarta and Dev Team. OpenLayers, 2006.