Loading...
Nature protocols2021Aug01Vol.16issue(8)

Metaneighborを使用した単一細胞トランスクリプトミクスの再現性のある研究を拡大します

,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, N.I.H., Extramural
  • Research Support, Non-U.S. Gov't
  • Review
概要
Abstract

単一細胞RNAシーケンスデータは、細胞型の多様性と組成の特性評価を大幅に進めています。ただし、セルタイプの定義はデータと分析のパイプラインによって異なり、セル型の妥当性と一般化性に関する懸念を引き起こします。Metaneighborを使用すると、データセットの独立性を維持し、データセット統合と比較して非常にスケーラブルな細胞型の複製可能性の効率的かつ堅牢な定量化を提案しました。このプロトコルでは、Metaneighborを使用して、遺伝子フィルタリング、隣接投票、視覚化という単純な3段階の手順に従って、細胞型の複製可能性を特徴付ける方法を示します。細胞型の複製可能性を定量化するためにこれらのステップを調整し、細胞型の同一性に寄与する遺伝子セットを決定し、参照分類法でモデルを前処理して、新しく生成されたデータを迅速に評価する方法を示します。このプロトコルは、BioconductorおよびGitHubから利用可能なオープンソースRパッケージに基づいており、RSTUDIOまたはRコマンドラインに基本的な知識が必要であり、通常、数百万の細胞で5分未満で実行できます。

単一細胞RNAシーケンスデータは、細胞型の多様性と組成の特性評価を大幅に進めています。ただし、セルタイプの定義はデータと分析のパイプラインによって異なり、セル型の妥当性と一般化性に関する懸念を引き起こします。Metaneighborを使用すると、データセットの独立性を維持し、データセット統合と比較して非常にスケーラブルな細胞型の複製可能性の効率的かつ堅牢な定量化を提案しました。このプロトコルでは、Metaneighborを使用して、遺伝子フィルタリング、隣接投票、視覚化という単純な3段階の手順に従って、細胞型の複製可能性を特徴付ける方法を示します。細胞型の複製可能性を定量化するためにこれらのステップを調整し、細胞型の同一性に寄与する遺伝子セットを決定し、参照分類法でモデルを前処理して、新しく生成されたデータを迅速に評価する方法を示します。このプロトコルは、BioconductorおよびGitHubから利用可能なオープンソースRパッケージに基づいており、RSTUDIOまたはRコマンドラインに基本的な知識が必要であり、通常、数百万の細胞で5分未満で実行できます。

Single-cell RNA-sequencing data have significantly advanced the characterization of cell-type diversity and composition. However, cell-type definitions vary across data and analysis pipelines, raising concerns about cell-type validity and generalizability. With MetaNeighbor, we proposed an efficient and robust quantification of cell-type replicability that preserves dataset independence and is highly scalable compared to dataset integration. In this protocol, we show how MetaNeighbor can be used to characterize cell-type replicability by following a simple three-step procedure: gene filtering, neighbor voting and visualization. We show how these steps can be tailored to quantify cell-type replicability, determine gene sets that contribute to cell-type identity and pretrain a model on a reference taxonomy to rapidly assess newly generated data. The protocol is based on an open-source R package available from Bioconductor and GitHub, requires basic familiarity with Rstudio or the R command line and can typically be run in <5 min for millions of cells.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google