Loading...
Briefings in bioinformatics2023Sep22Vol.24issue(6)

グラフニューラルネットワークを使用して、単一細胞RNA-seqデータからの遺伝子調節リンクの予測

,
,
,
,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

シングルセルRNAシーケンス(SCRNA-seq)は、単一細胞レベルで遺伝子発現パターンを研究するための強力な手法として浮上しています。SCRNA-seqデータから遺伝子調節ネットワーク(GRNS)を推測することで、ゲノムレベルからの細胞表現型に関する洞察が得られます。ただし、SCRNA-seqデータに固有の高いスパース、ノイズ、ドロップアウトイベントは、GRN推論の課題を提示します。近年、DNAに結合する実験的に検証された転写因子に関するデータの劇的な増加により、監視された方法によってGRNを推測することが可能になりました。この研究では、グラフリンク予測タスクとしてフレーミングすることにより、GRN推論の問題に対処します。この論文では、Gnnlinkと呼ばれる新しいフレームワークを提案します。Gnnlinkは、既知のGRNを活用して、遺伝子間の潜在的な調節的相互依存性を推定することを提案します。まず、RAW SCRNA-seqデータを前処理します。次に、ネットワーク内のノード間の相互依存関係をキャプチャすることにより、遺伝子機能を効果的に改良するために、グラフ畳み込みネットワークベースのインタラクショングラフエンコーダを導入します。最後に、GRNの推論は、ノード機能でマトリックス完了操作を実行することにより取得されます。モデルトレーニングから得られる機能は、類似性の測定や遺伝子ペア間の因果関係の推測などの下流タスクに適用できます。GNNLINKのパフォーマンスを評価するために、7つのSCRNA-seqデータセットを使用して、既存のGRN再構成方法と比較します。これらのデータセットには、機能的相互作用ネットワーク、関数データの喪失/関数データ、非固有のCHIP-seqデータ、セルタイプ固有のChIP-seqデータなど、多様なグラウンドトゥルースネットワークが含まれます。実験結果は、GNNLINKがこれらのデータセット全体で同等または優れたパフォーマンスを達成し、その堅牢性と精度を紹介することを示しています。さらに、さまざまなスケールのデータセット間で一貫したパフォーマンスを観察します。再現性のために、GitHubリポジトリ(https://github.com/sdesignates/gnnlink)にGnnlinkのデータとソースコードを提供します。

シングルセルRNAシーケンス(SCRNA-seq)は、単一細胞レベルで遺伝子発現パターンを研究するための強力な手法として浮上しています。SCRNA-seqデータから遺伝子調節ネットワーク(GRNS)を推測することで、ゲノムレベルからの細胞表現型に関する洞察が得られます。ただし、SCRNA-seqデータに固有の高いスパース、ノイズ、ドロップアウトイベントは、GRN推論の課題を提示します。近年、DNAに結合する実験的に検証された転写因子に関するデータの劇的な増加により、監視された方法によってGRNを推測することが可能になりました。この研究では、グラフリンク予測タスクとしてフレーミングすることにより、GRN推論の問題に対処します。この論文では、Gnnlinkと呼ばれる新しいフレームワークを提案します。Gnnlinkは、既知のGRNを活用して、遺伝子間の潜在的な調節的相互依存性を推定することを提案します。まず、RAW SCRNA-seqデータを前処理します。次に、ネットワーク内のノード間の相互依存関係をキャプチャすることにより、遺伝子機能を効果的に改良するために、グラフ畳み込みネットワークベースのインタラクショングラフエンコーダを導入します。最後に、GRNの推論は、ノード機能でマトリックス完了操作を実行することにより取得されます。モデルトレーニングから得られる機能は、類似性の測定や遺伝子ペア間の因果関係の推測などの下流タスクに適用できます。GNNLINKのパフォーマンスを評価するために、7つのSCRNA-seqデータセットを使用して、既存のGRN再構成方法と比較します。これらのデータセットには、機能的相互作用ネットワーク、関数データの喪失/関数データ、非固有のCHIP-seqデータ、セルタイプ固有のChIP-seqデータなど、多様なグラウンドトゥルースネットワークが含まれます。実験結果は、GNNLINKがこれらのデータセット全体で同等または優れたパフォーマンスを達成し、その堅牢性と精度を紹介することを示しています。さらに、さまざまなスケールのデータセット間で一貫したパフォーマンスを観察します。再現性のために、GitHubリポジトリ(https://github.com/sdesignates/gnnlink)にGnnlinkのデータとソースコードを提供します。

Single-cell RNA-sequencing (scRNA-seq) has emerged as a powerful technique for studying gene expression patterns at the single-cell level. Inferring gene regulatory networks (GRNs) from scRNA-seq data provides insight into cellular phenotypes from the genomic level. However, the high sparsity, noise and dropout events inherent in scRNA-seq data present challenges for GRN inference. In recent years, the dramatic increase in data on experimentally validated transcription factors binding to DNA has made it possible to infer GRNs by supervised methods. In this study, we address the problem of GRN inference by framing it as a graph link prediction task. In this paper, we propose a novel framework called GNNLink, which leverages known GRNs to deduce the potential regulatory interdependencies between genes. First, we preprocess the raw scRNA-seq data. Then, we introduce a graph convolutional network-based interaction graph encoder to effectively refine gene features by capturing interdependencies between nodes in the network. Finally, the inference of GRN is obtained by performing matrix completion operation on node features. The features obtained from model training can be applied to downstream tasks such as measuring similarity and inferring causality between gene pairs. To evaluate the performance of GNNLink, we compare it with six existing GRN reconstruction methods using seven scRNA-seq datasets. These datasets encompass diverse ground truth networks, including functional interaction networks, Loss of Function/Gain of Function data, non-specific ChIP-seq data and cell-type-specific ChIP-seq data. Our experimental results demonstrate that GNNLink achieves comparable or superior performance across these datasets, showcasing its robustness and accuracy. Furthermore, we observe consistent performance across datasets of varying scales. For reproducibility, we provide the data and source code of GNNLink on our GitHub repository: https://github.com/sdesignates/GNNLink.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google