著名医師による解説が無料で読めます
すると翻訳の精度が向上します
シングルセルRNA-seq(SCRNA-seq)技術の最近の開発により、膨大な生物学的発見が生じています。SCRNA-seq研究のスケールが増加するにつれて、分析における大きな課題はバッチ効果であり、これはヒト組織を含む研究では避けられません。ほとんどの既存の方法は、低次元の埋め込みスペースでバッチ効果を削除します。クラスタリングに役立ちますが、バッチ効果は遺伝子発現空間に依然として存在し、下流の遺伝子レベルの分析がバッチ効果に影響を受けやすくなります。最近の研究では、遺伝子発現空間におけるバッチ効果補正が埋め込み空間よりもはるかに難しいことが示されています。Seurat 3.0などの方法は、遺伝子発現のバッチエフェクトを削除するために相互最近隣接(MNN)アプローチに依存していますが、MNNは一度に2つのバッチのみを分析することができ、バッチの数が多い場合に計算的に実行不可能になります。ここでは、埋め込みと遺伝子発現空間の両方でバッチ効果を修正しながら、SCRNA-seqデータを同時に除去し、除去する共同ディープラーニングモデルであるCardecを提示します。さまざまな種と組織にまたがる包括的な評価により、CardecはScanorama、DCA + Combat、SCVI、およびMNNを上回ることが示されました。Cardec除去により、非高度に可変性のある遺伝子は、非常に可変性のある遺伝子(HVG)と同じくらいクラスタリングに多くのシグナルを提供し、CardecがScrna-seqの情報コンテンツを大幅に増やしたことを示唆しています。また、入力としてのCardecの除去およびバッチ補正された発現を使用した軌道分析は、バッチ効果の存在下で不明瞭になっているマーカー遺伝子と転写因子を明らかにしたことを示しました。Cardecは計算高速であるため、大規模なSCRNA-seq研究のための望ましいツールになっています。
シングルセルRNA-seq(SCRNA-seq)技術の最近の開発により、膨大な生物学的発見が生じています。SCRNA-seq研究のスケールが増加するにつれて、分析における大きな課題はバッチ効果であり、これはヒト組織を含む研究では避けられません。ほとんどの既存の方法は、低次元の埋め込みスペースでバッチ効果を削除します。クラスタリングに役立ちますが、バッチ効果は遺伝子発現空間に依然として存在し、下流の遺伝子レベルの分析がバッチ効果に影響を受けやすくなります。最近の研究では、遺伝子発現空間におけるバッチ効果補正が埋め込み空間よりもはるかに難しいことが示されています。Seurat 3.0などの方法は、遺伝子発現のバッチエフェクトを削除するために相互最近隣接(MNN)アプローチに依存していますが、MNNは一度に2つのバッチのみを分析することができ、バッチの数が多い場合に計算的に実行不可能になります。ここでは、埋め込みと遺伝子発現空間の両方でバッチ効果を修正しながら、SCRNA-seqデータを同時に除去し、除去する共同ディープラーニングモデルであるCardecを提示します。さまざまな種と組織にまたがる包括的な評価により、CardecはScanorama、DCA + Combat、SCVI、およびMNNを上回ることが示されました。Cardec除去により、非高度に可変性のある遺伝子は、非常に可変性のある遺伝子(HVG)と同じくらいクラスタリングに多くのシグナルを提供し、CardecがScrna-seqの情報コンテンツを大幅に増やしたことを示唆しています。また、入力としてのCardecの除去およびバッチ補正された発現を使用した軌道分析は、バッチ効果の存在下で不明瞭になっているマーカー遺伝子と転写因子を明らかにしたことを示しました。Cardecは計算高速であるため、大規模なSCRNA-seq研究のための望ましいツールになっています。
Recent developments of single-cell RNA-seq (scRNA-seq) technologies have led to enormous biological discoveries. As the scale of scRNA-seq studies increases, a major challenge in analysis is batch effects, which are inevitable in studies involving human tissues. Most existing methods remove batch effects in a low-dimensional embedding space. Although useful for clustering, batch effects are still present in the gene expression space, leaving downstream gene-level analysis susceptible to batch effects. Recent studies have shown that batch effect correction in the gene expression space is much harder than in the embedding space. Methods such as Seurat 3.0 rely on the mutual nearest neighbor (MNN) approach to remove batch effects in gene expression, but MNN can only analyze two batches at a time, and it becomes computationally infeasible when the number of batches is large. Here, we present CarDEC, a joint deep learning model that simultaneously clusters and denoises scRNA-seq data while correcting batch effects both in the embedding and the gene expression space. Comprehensive evaluations spanning different species and tissues showed that CarDEC outperforms Scanorama, DCA + Combat, scVI, and MNN. With CarDEC denoising, non-highly variable genes offer as much signal for clustering as the highly variable genes (HVGs), suggesting that CarDEC substantially boosted information content in scRNA-seq. We also showed that trajectory analysis using CarDEC's denoised and batch-corrected expression as input revealed marker genes and transcription factors that are otherwise obscured in the presence of batch effects. CarDEC is computationally fast, making it a desirable tool for large-scale scRNA-seq studies.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。