Loading...
Frontiers in genetics20230101Vol.14issue()

マルチオミクスデータと既知の分子相互作用を統合することにより、機能性遺伝子モジュールの識別

,
,
,
,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

マルチオミクスのデータ統合は、患者サブグループを特定するための有望なアプローチとして浮上しています。ただし、遺伝子(または遺伝子産物)を共発現モジュールにグループ化するという点では、データ統合方法は2つの主要な欠点に悩まされています。まず、ほとんどの既存の方法は、すべての異なるデータセットで測定された遺伝子またはサンプルのみを考慮します。第二に、既知の分子相互作用(たとえば、転写調節相互作用、タンパク質 - タンパク質相互作用、生物学的経路など)を使用して、モジュールの検出を支援することはできません。ここでは、これらの制限に対処するための2つの方法論的革新を提供する、メンバーシップの相関ベースの局所近似(CLAM)の新しいデータ統合フレームワークを提示します。、および2)局所近似手順を使用して、マトリックスから遺伝子モジュールを定義します。メンバーシップの相関ベースの局所近似(CRC)およびがんゲノムアトラス(TCGA)、臨床プロテオミクス腫瘍分析コンソーシアム(CPTAC)、遺伝子発現オムニブス(GEO)から得られたマウスB細胞分化マルチオミクスデータを適用するまた、プロテオメクシェンジデータベースでは、生物学的に関連するモジュールと遺伝子オントロジー(GO)用語を回復する優れた能力を実証しました。結腸直腸癌モジュールのさらなる調査により、大腸がんの進行において重要な役割を果たした多数の転写因子とKEGG経路が明らかになりました。モジュールベースの生存分析では、ペアワイズ遺伝子相関が結腸直腸癌患者の生存と有意に相関する4つの生存関連ネットワークを構築しました。全体として、一連の評価は、複雑な疾患のモジュラーバイオマーカーを特定するためのメンバーシップの相関ベースの局所近似の大きな可能性を実証しました。https://github.com/free1234hm/clamで利用できるユーザーフレンドリーなアプリケーションとして、メンバーシップの相関ベースのローカル近似を実装しました。

マルチオミクスのデータ統合は、患者サブグループを特定するための有望なアプローチとして浮上しています。ただし、遺伝子(または遺伝子産物)を共発現モジュールにグループ化するという点では、データ統合方法は2つの主要な欠点に悩まされています。まず、ほとんどの既存の方法は、すべての異なるデータセットで測定された遺伝子またはサンプルのみを考慮します。第二に、既知の分子相互作用(たとえば、転写調節相互作用、タンパク質 - タンパク質相互作用、生物学的経路など)を使用して、モジュールの検出を支援することはできません。ここでは、これらの制限に対処するための2つの方法論的革新を提供する、メンバーシップの相関ベースの局所近似(CLAM)の新しいデータ統合フレームワークを提示します。、および2)局所近似手順を使用して、マトリックスから遺伝子モジュールを定義します。メンバーシップの相関ベースの局所近似(CRC)およびがんゲノムアトラス(TCGA)、臨床プロテオミクス腫瘍分析コンソーシアム(CPTAC)、遺伝子発現オムニブス(GEO)から得られたマウスB細胞分化マルチオミクスデータを適用するまた、プロテオメクシェンジデータベースでは、生物学的に関連するモジュールと遺伝子オントロジー(GO)用語を回復する優れた能力を実証しました。結腸直腸癌モジュールのさらなる調査により、大腸がんの進行において重要な役割を果たした多数の転写因子とKEGG経路が明らかになりました。モジュールベースの生存分析では、ペアワイズ遺伝子相関が結腸直腸癌患者の生存と有意に相関する4つの生存関連ネットワークを構築しました。全体として、一連の評価は、複雑な疾患のモジュラーバイオマーカーを特定するためのメンバーシップの相関ベースの局所近似の大きな可能性を実証しました。https://github.com/free1234hm/clamで利用できるユーザーフレンドリーなアプリケーションとして、メンバーシップの相関ベースのローカル近似を実装しました。

Multi-omics data integration has emerged as a promising approach to identify patient subgroups. However, in terms of grouping genes (or gene products) into co-expression modules, data integration methods suffer from two main drawbacks. First, most existing methods only consider genes or samples measured in all different datasets. Second, known molecular interactions (e.g., transcriptional regulatory interactions, protein-protein interactions and biological pathways) cannot be utilized to assist in module detection. Herein, we present a novel data integration framework, Correlation-based Local Approximation of Membership (CLAM), which provides two methodological innovations to address these limitations: 1) constructing a trans-omics neighborhood matrix by integrating multi-omics datasets and known molecular interactions, and 2) using a local approximation procedure to define gene modules from the matrix. Applying Correlation-based Local Approximation of Membership to human colorectal cancer (CRC) and mouse B-cell differentiation multi-omics data obtained from The Cancer Genome Atlas (TCGA), Clinical Proteomics Tumor Analysis Consortium (CPTAC), Gene Expression Omnibus (GEO) and ProteomeXchange database, we demonstrated its superior ability to recover biologically relevant modules and gene ontology (GO) terms. Further investigation of the colorectal cancer modules revealed numerous transcription factors and KEGG pathways that played crucial roles in colorectal cancer progression. Module-based survival analysis constructed four survival-related networks in which pairwise gene correlations were significantly correlated with colorectal cancer patient survival. Overall, the series of evaluations demonstrated the great potential of Correlation-based Local Approximation of Membership for identifying modular biomarkers for complex diseases. We implemented Correlation-based Local Approximation of Membership as a user-friendly application available at https://github.com/free1234hm/CLAM.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google