Loading...
Bioinformatics (Oxford, England)2015Jun15Vol.31issue(12)

遺伝子調節ネットワーク推論のための統合ランダムフォレスト

,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, N.I.H., Extramural
  • Research Support, Non-U.S. Gov't
概要
Abstract

動機:ゲノムデータに基づく遺伝子調節ネットワーク(GRN)推論は、最も積極的に追求されている計算生物学的問題の1つです。さまざまな種類の生物学的データは通常、基礎となるGRNに関する補完的な情報を提供するため、多様なタイプのビッグデータを統合するモデルは、GRN推論のパワーと精度の両方を増加させると予想されます。この目標に向けて、遺伝子調節ネットワーク推論のためのIrafnet:統合ランダムフォレストという名前の新しいアルゴリズムを提案します。 結果:IraFNETは、タンパク質間相互作用、転写因子(TF)-DNA結合、遺伝子ノックダウンなど、異種データからの情報をGRN推論のために共同で考慮することができる柔軟で統合された統合フレームワークです。Dream4およびDream5の課題からのテストデータを使用して、Irafnetが元のランダムフォレストベースのネットワーク推論アルゴリズム(GENIE3)を上回ることを実証し、コミュニティ学習アプローチに非常に匹敵します。IrafNetをサクチャーミセスセレビシアのGRNを構築し、TFターゲット遺伝子調節の予測におけるパフォーマンスを改善し、予測された遺伝子調節に追加の機能的洞察を提供することを実証します。 可用性と実装:IRAFNET実装のRコードとチュートリアルは、http://research.mssm.edu/tulab/software/irafnet.htmlで入手できます。

動機:ゲノムデータに基づく遺伝子調節ネットワーク(GRN)推論は、最も積極的に追求されている計算生物学的問題の1つです。さまざまな種類の生物学的データは通常、基礎となるGRNに関する補完的な情報を提供するため、多様なタイプのビッグデータを統合するモデルは、GRN推論のパワーと精度の両方を増加させると予想されます。この目標に向けて、遺伝子調節ネットワーク推論のためのIrafnet:統合ランダムフォレストという名前の新しいアルゴリズムを提案します。 結果:IraFNETは、タンパク質間相互作用、転写因子(TF)-DNA結合、遺伝子ノックダウンなど、異種データからの情報をGRN推論のために共同で考慮することができる柔軟で統合された統合フレームワークです。Dream4およびDream5の課題からのテストデータを使用して、Irafnetが元のランダムフォレストベースのネットワーク推論アルゴリズム(GENIE3)を上回ることを実証し、コミュニティ学習アプローチに非常に匹敵します。IrafNetをサクチャーミセスセレビシアのGRNを構築し、TFターゲット遺伝子調節の予測におけるパフォーマンスを改善し、予測された遺伝子調節に追加の機能的洞察を提供することを実証します。 可用性と実装:IRAFNET実装のRコードとチュートリアルは、http://research.mssm.edu/tulab/software/irafnet.htmlで入手できます。

MOTIVATION: Gene regulatory network (GRN) inference based on genomic data is one of the most actively pursued computational biological problems. Because different types of biological data usually provide complementary information regarding the underlying GRN, a model that integrates big data of diverse types is expected to increase both the power and accuracy of GRN inference. Towards this goal, we propose a novel algorithm named iRafNet: integrative random forest for gene regulatory network inference. RESULTS: iRafNet is a flexible, unified integrative framework that allows information from heterogeneous data, such as protein-protein interactions, transcription factor (TF)-DNA-binding, gene knock-down, to be jointly considered for GRN inference. Using test data from the DREAM4 and DREAM5 challenges, we demonstrate that iRafNet outperforms the original random forest based network inference algorithm (GENIE3), and is highly comparable to the community learning approach. We apply iRafNet to construct GRN in Saccharomyces cerevisiae and demonstrate that it improves the performance in predicting TF-target gene regulations and provides additional functional insights to the predicted gene regulations. AVAILABILITY AND IMPLEMENTATION: The R code of iRafNet implementation and a tutorial are available at: http://research.mssm.edu/tulab/software/irafnet.html

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google