著名医師による解説が無料で読めます
すると翻訳の精度が向上します
背景:タンパク質機能の予測は、ゲノム後の時代の重要な問題です。実験生物学の最近の進歩により、膨大な量のタンパク質間相互作用(PPI)データの生産が可能になりました。したがって、PPIデータを使用して機能的にタンパク質を注釈を付けていることが広く研究されています。ただし、ほとんどの既存のネットワークベースのアプローチは、ネットワークで注釈と相互作用情報が不十分な場合、うまく機能しません。 結果:この論文では、PPI情報とタンパク質シーケンス情報を組み合わせて、集合分類に基づいて予測パフォーマンスを高める新しい方法を提案しました。私たちの方法は、関数の予測を2つのフェーズに分割します。まず、元のPPIネットワークは、タンパク質配列情報から推測される多くのエッジを追加することにより濃縮されます。追加されたエッジを暗黙のエッジと呼び、既存のエッジはそれに応じて明示的なエッジを明示的に呼びます。第二に、タンパク質機能を予測するために、新しいネットワークで集合分類アルゴリズムが採用されています。 結論:2つの実際の公開されているPPIデータセットで広範な実験を行いました。4つの既存のタンパク質機能予測アプローチと比較して、私たちの方法は多くの状況でパフォーマンスが向上します。これは、暗黙のエッジを追加すると予測のパフォーマンスが実際に向上する可能性があることを示しています。さらに、実験結果は、我々の方法がまばらに標識されたネットワークの比較アプローチよりも大幅に優れていることを示しており、注釈付きタンパク質の割合の変化に対して堅牢であることを示しています。
背景:タンパク質機能の予測は、ゲノム後の時代の重要な問題です。実験生物学の最近の進歩により、膨大な量のタンパク質間相互作用(PPI)データの生産が可能になりました。したがって、PPIデータを使用して機能的にタンパク質を注釈を付けていることが広く研究されています。ただし、ほとんどの既存のネットワークベースのアプローチは、ネットワークで注釈と相互作用情報が不十分な場合、うまく機能しません。 結果:この論文では、PPI情報とタンパク質シーケンス情報を組み合わせて、集合分類に基づいて予測パフォーマンスを高める新しい方法を提案しました。私たちの方法は、関数の予測を2つのフェーズに分割します。まず、元のPPIネットワークは、タンパク質配列情報から推測される多くのエッジを追加することにより濃縮されます。追加されたエッジを暗黙のエッジと呼び、既存のエッジはそれに応じて明示的なエッジを明示的に呼びます。第二に、タンパク質機能を予測するために、新しいネットワークで集合分類アルゴリズムが採用されています。 結論:2つの実際の公開されているPPIデータセットで広範な実験を行いました。4つの既存のタンパク質機能予測アプローチと比較して、私たちの方法は多くの状況でパフォーマンスが向上します。これは、暗黙のエッジを追加すると予測のパフォーマンスが実際に向上する可能性があることを示しています。さらに、実験結果は、我々の方法がまばらに標識されたネットワークの比較アプローチよりも大幅に優れていることを示しており、注釈付きタンパク質の割合の変化に対して堅牢であることを示しています。
BACKGROUND: Protein function prediction is an important problem in the post-genomic era. Recent advances in experimental biology have enabled the production of vast amounts of protein-protein interaction (PPI) data. Thus, using PPI data to functionally annotate proteins has been extensively studied. However, most existing network-based approaches do not work well when annotation and interaction information is inadequate in the networks. RESULTS: In this paper, we proposed a new method that combines PPI information and protein sequence information to boost the prediction performance based on collective classification. Our method divides function prediction into two phases: First, the original PPI network is enriched by adding a number of edges that are inferred from protein sequence information. We call the added edges implicit edges, and the existing ones explicit edges correspondingly. Second, a collective classification algorithm is employed on the new network to predict protein function. CONCLUSIONS: We conducted extensive experiments on two real, publicly available PPI datasets. Compared to four existing protein function prediction approaches, our method performs better in many situations, which shows that adding implicit edges can indeed improve the prediction performance. Furthermore, the experimental results also indicate that our method is significantly better than the compared approaches in sparsely-labeled networks, and it is robust to the change of the proportion of annotated proteins.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。