Loading...
IEEE transactions on nanobioscience2015Jan01Vol.14issue(1)

RGFinder:GOグラフ最小スパニングツリーを使用して、意味的に関連する遺伝子を決定するためのシステム

,
文献タイプ:
  • Journal Article
概要
Abstract

生物学者は、特定の遺伝子に最も機能的かつ意味的に関連する遺伝子のセットを知る必要があることがよくあります。S 'を決定するために、ほとんどの現在の遺伝子類似性測定値は、SETに注釈を付けた遺伝子オントロジー(GO)の用語間の構造的依存性を見落とします。これは誤った結果につながる可能性があります。このホワイトペーパーでは、存在依存性の概念を採用することにより、GO用語間の構造的依存関係を考慮するRGFinderと呼ばれる生物学的検索エンジンを紹介します。rgfinderは、GOグラフの各エッジに重量を割り当て、エッジで接続された2つのGO用語間の関連性の程度を表します。重量の値は、次の要因に基づいて決定されます。1)エッジで表される関係のタイプ(たとえば、「IS-A」関係は「関係の一部とは異なる重みに割り当てられます)、2)エッジで接続された2つのGO用語の機能的な関係、および3)、エッジによって接続された2つのGO用語の名前間のストリングサブストリングの関係。rgfinderは、これらの重みに基づいて、最小スパニングツリーオブゴーグラフを構築します。rgfinderのフレームワークでは、セットs 'は、セットSを注釈付けするGO用語を通過する最小スパニングツリーの最低収束にあるGO用語に注釈されます。RGFINDERを実験的に評価し、4つの遺伝子セット濃縮システムと比較しました。結果は著しい改善を示しました。

生物学者は、特定の遺伝子に最も機能的かつ意味的に関連する遺伝子のセットを知る必要があることがよくあります。S 'を決定するために、ほとんどの現在の遺伝子類似性測定値は、SETに注釈を付けた遺伝子オントロジー(GO)の用語間の構造的依存性を見落とします。これは誤った結果につながる可能性があります。このホワイトペーパーでは、存在依存性の概念を採用することにより、GO用語間の構造的依存関係を考慮するRGFinderと呼ばれる生物学的検索エンジンを紹介します。rgfinderは、GOグラフの各エッジに重量を割り当て、エッジで接続された2つのGO用語間の関連性の程度を表します。重量の値は、次の要因に基づいて決定されます。1)エッジで表される関係のタイプ(たとえば、「IS-A」関係は「関係の一部とは異なる重みに割り当てられます)、2)エッジで接続された2つのGO用語の機能的な関係、および3)、エッジによって接続された2つのGO用語の名前間のストリングサブストリングの関係。rgfinderは、これらの重みに基づいて、最小スパニングツリーオブゴーグラフを構築します。rgfinderのフレームワークでは、セットs 'は、セットSを注釈付けするGO用語を通過する最小スパニングツリーの最低収束にあるGO用語に注釈されます。RGFINDERを実験的に評価し、4つの遺伝子セット濃縮システムと比較しました。結果は著しい改善を示しました。

Biologists often need to know the set S' of genes that are the most functionally and semantically related to a given set S of genes. For determining the set S', most current gene similarity measures overlook the structural dependencies among the Gene Ontology (GO) terms annotating the set S, which may lead to erroneous results. We introduce in this paper a biological search engine called RGFinder that considers the structural dependencies among GO terms by employing the concept of existence dependency. RGFinder assigns a weight to each edge in GO graph to represent the degree of relatedness between the two GO terms connected by the edge. The value of the weight is determined based on the following factors: 1) type of the relation represented by the edge (e.g., an "is-a" relation is assigned a different weight than a "part-of" relation), 2) the functional relationship between the two GO terms connected by the edge, and 3) the string-substring relationship between the names of the two GO terms connected by the edge. RGFinder then constructs a minimum spanning tree of GO graph based on these weights. In the framework of RGFinder, the set S' is annotated to the GO terms located at the lowest convergences of the subtree of the minimum spanning tree that passes through the GO terms annotating set S. We evaluated RGFinder experimentally and compared it with four gene set enrichment systems. Results showed marked improvement.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google