Loading...
Journal of computational biology : a journal of computational molecular cell biology2022Jan01Vol.29issue(1)

Scotによるシングルセルマルチオミクス統合

,
,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, N.I.H., Extramural
  • Research Support, U.S. Gov't, Non-P.H.S.
概要
Abstract

さまざまなシーケンステクノロジーの可用性により、いくつかの共同アサイテクノロジーを除き、単一細胞分解能で異なるゲノム特性をキャプチャすることができますが、同じ単一セルに異なるシーケンスアッセイを適用することは不可能です。最適輸送(SCOT)を使用したシングルセルアラインメントは、最適なトランスポートを使用して単一セルマルチオミクスデータを整列させることにより、この制限に対処する監視なしのアルゴリズムです。まず、各データセット(またはドメイン)のk-nearest neight(k-nn)グラフを構築してドメイン内距離をキャプチャすることにより、ローカルジオメトリを保存します。スコットは、ドメイン内距離マトリックス間の矛盾を最小限に抑える確率的結合マトリックスを見つけます。最後に、カップリングマトリックスを使用して、1つのシングルセルデータセットを別のセットに投影して、Barycentric Projectionを介してそれらを調整します。Scotは2つのハイパーパラメーターのみを調整する必要があり、1つの選択に堅牢です。さらに、アルゴリズムのGromov-Wasserstein距離は、直交アライメント情報が利用できない場合、完全に監視されていない設定でScotのハイパーパラメーターチューニングをガイドできます。したがって、SCOTは、実際の監視なしのシングルセルデータアライメントシナリオで、ハイパーパラメーター選択のためのヒューリスティックを提供する高速で正確なアライメント方法です。Scotのチュートリアルを提供し、そのソースコードをGitHubで公開しています。

さまざまなシーケンステクノロジーの可用性により、いくつかの共同アサイテクノロジーを除き、単一細胞分解能で異なるゲノム特性をキャプチャすることができますが、同じ単一セルに異なるシーケンスアッセイを適用することは不可能です。最適輸送(SCOT)を使用したシングルセルアラインメントは、最適なトランスポートを使用して単一セルマルチオミクスデータを整列させることにより、この制限に対処する監視なしのアルゴリズムです。まず、各データセット(またはドメイン)のk-nearest neight(k-nn)グラフを構築してドメイン内距離をキャプチャすることにより、ローカルジオメトリを保存します。スコットは、ドメイン内距離マトリックス間の矛盾を最小限に抑える確率的結合マトリックスを見つけます。最後に、カップリングマトリックスを使用して、1つのシングルセルデータセットを別のセットに投影して、Barycentric Projectionを介してそれらを調整します。Scotは2つのハイパーパラメーターのみを調整する必要があり、1つの選択に堅牢です。さらに、アルゴリズムのGromov-Wasserstein距離は、直交アライメント情報が利用できない場合、完全に監視されていない設定でScotのハイパーパラメーターチューニングをガイドできます。したがって、SCOTは、実際の監視なしのシングルセルデータアライメントシナリオで、ハイパーパラメーター選択のためのヒューリスティックを提供する高速で正確なアライメント方法です。Scotのチュートリアルを提供し、そのソースコードをGitHubで公開しています。

Although the availability of various sequencing technologies allows us to capture different genome properties at single-cell resolution, with the exception of a few co-assaying technologies, applying different sequencing assays on the same single cell is impossible. Single-cell alignment using optimal transport (SCOT) is an unsupervised algorithm that addresses this limitation by using optimal transport to align single-cell multiomics data. First, it preserves the local geometry by constructing a k-nearest neighbor (k-NN) graph for each data set (or domain) to capture the intra-domain distances. SCOT then finds a probabilistic coupling matrix that minimizes the discrepancy between the intra-domain distance matrices. Finally, it uses the coupling matrix to project one single-cell data set onto another through barycentric projection, thus aligning them. SCOT requires tuning only two hyperparameters and is robust to the choice of one. Furthermore, the Gromov-Wasserstein distance in the algorithm can guide SCOT's hyperparameter tuning in a fully unsupervised setting when no orthogonal alignment information is available. Thus, SCOT is a fast and accurate alignment method that provides a heuristic for hyperparameter selection in a real-world unsupervised single-cell data alignment scenario. We provide a tutorial for SCOT and make its source code publicly available on GitHub.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google