Loading...
※翻訳は機械翻訳サービスを利用しております
IEEE/ACM transactions on computational biology and bioinformatics20220101Vol.19issue(2)

SCLRTD:シングルセルマルチオミクスシーケンスデータに欠損値を帰属させるための新しい低ランクテンソル分解方法

,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

シングルセルシーケンステクノロジーの適用が成功したため、多数のシングルセルマルチオミクスシーケンス(SCMO-SEQ)データが生成され、研究者が個々の細胞間の不均一性を研究できるようになりました。単一細胞データ分析における顕著な問題の1つは、実験中の増幅の障害によって引き起こされるドロップアウトの有病率です。欠損値を帰属させるための効果的なアプローチを開発する必要があります。単一タイプの単一セルデータを帰属させる一般的な方法とは異なり、SCMO-seqデータとシングルセルRNAシーケンス(SCRNA-seq)データを核に基づいて低ランクテンソル分解を使用して、SCLRTDと呼ばれる代入法を提案します。さまざまな段階、組織、または状態があります。さらに、マウス胚性幹細胞と肝細胞癌からの4セットのシミュレーションと2セットの実際のSCRNA-seqデータをそれぞれ使用して、数値実験を実行し、他の6つの公開された方法と比較します。エラー精度とクラスタリングの結果は、提案された方法の有効性を示しています。さらに、肝細胞癌から実際のSCMO-seqデータを帰属させた後、2つの細胞亜集団を明確に特定します。さらに、遺伝子オントロジーは、肝細胞癌の代謝に関連する胆汁分泌経路の7つの遺伝子を識別します。データベースTCGAを使用した生存分析では、帰属後の2つの細胞亜集団が生存率が際立っていることも示しています。

シングルセルシーケンステクノロジーの適用が成功したため、多数のシングルセルマルチオミクスシーケンス(SCMO-SEQ)データが生成され、研究者が個々の細胞間の不均一性を研究できるようになりました。単一細胞データ分析における顕著な問題の1つは、実験中の増幅の障害によって引き起こされるドロップアウトの有病率です。欠損値を帰属させるための効果的なアプローチを開発する必要があります。単一タイプの単一セルデータを帰属させる一般的な方法とは異なり、SCMO-seqデータとシングルセルRNAシーケンス(SCRNA-seq)データを核に基づいて低ランクテンソル分解を使用して、SCLRTDと呼ばれる代入法を提案します。さまざまな段階、組織、または状態があります。さらに、マウス胚性幹細胞と肝細胞癌からの4セットのシミュレーションと2セットの実際のSCRNA-seqデータをそれぞれ使用して、数値実験を実行し、他の6つの公開された方法と比較します。エラー精度とクラスタリングの結果は、提案された方法の有効性を示しています。さらに、肝細胞癌から実際のSCMO-seqデータを帰属させた後、2つの細胞亜集団を明確に特定します。さらに、遺伝子オントロジーは、肝細胞癌の代謝に関連する胆汁分泌経路の7つの遺伝子を識別します。データベースTCGAを使用した生存分析では、帰属後の2つの細胞亜集団が生存率が際立っていることも示しています。

With the successful application of single-cell sequencing technology, a large number of single-cell multi-omics sequencing (scMO-seq)data have been generated, which enables researchers to study heterogeneity between individual cells. One prominent problem in single-cell data analysis is the prevalence of dropouts, caused by failures in amplification during the experiments. It is necessary to develop effective approaches for imputing the missing values. Different with general methods imputing single type of single-cell data, we propose an imputation method called scLRTD, using low-rank tensor decomposition based on nuclear norm to impute scMO-seq data and single-cell RNA-sequencing (scRNA-seq)data with different stages, tissues or conditions. Furthermore, four sets of simulated and two sets of real scRNA-seq data from mouse embryonic stem cells and hepatocellular carcinoma, respectively, are used to carry out numerical experiments and compared with other six published methods. Error accuracy and clustering results demonstrate the effectiveness of proposed method. Moreover, we clearly identify two cell subpopulations after imputing the real scMO-seq data from hepatocellular carcinoma. Further, Gene Ontology identifies 7 genes in Bile secretion pathway, which is related to metabolism in hepatocellular carcinoma. The survival analysis using the database TCGA also show that two cell subpopulations after imputing have distinguished survival rates.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google