Loading...
Bioinformatics (Oxford, England)2018Mar01Vol.34issue(5)

Deepre:ディープラーニングによるシーケンスベースの酵素EC数予測

,
,
,
,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

動機:酵素機能の注釈には、メタゲノミクス、産業バイオテクノロジー、酵素欠乏症疾患の診断など、幅広い用途があります。ただし、必要な時間とリソースにより、すべての酵素の機能を実験的に決定するのは非常に高価です。したがって、計算酵素機能予測がますます重要になっています。この論文では、このようなアプローチを開発し、酵素委員会の数を予測することにより酵素機能を決定します。 結果:酵素機能予測の分野で、エンドツーエンドの特徴の選択と分類モデルトレーニングアプローチ、および自動で堅牢な機能次元均一化方法、Deepreを提案します。酵素シーケンスから手動で作成された機能を抽出する代わりに、モデルは生のシーケンスを入力としてエンコードし、分類結果に基づいて生のエンコードから畳み込みと順次の特徴を抽出し、予測パフォーマンスを直接改善します。2つの大規模なデータセットで行われた徹底的な相互倍率検証実験は、Deepreが以前の最先端の方法で予測パフォーマンスを改善することを示しています。さらに、当社のサーバーは、別の低浸透量データセット上の酵素のメインクラスを決定する際に、他の5つのサーバーを上回ります。2つのケーススタディは、酵素アイソフォームの機能的違いを捉えるDeepreの能力を示しています。 可用性と実装:サーバーはhttp://www.cbrc.kaust.edu.sa/deepreで自由にアクセスできます。 連絡先:xin.gao@kaust.edu.sa。 補足情報:補足データは、バイオインフォマティクスオンラインで入手できます。

動機:酵素機能の注釈には、メタゲノミクス、産業バイオテクノロジー、酵素欠乏症疾患の診断など、幅広い用途があります。ただし、必要な時間とリソースにより、すべての酵素の機能を実験的に決定するのは非常に高価です。したがって、計算酵素機能予測がますます重要になっています。この論文では、このようなアプローチを開発し、酵素委員会の数を予測することにより酵素機能を決定します。 結果:酵素機能予測の分野で、エンドツーエンドの特徴の選択と分類モデルトレーニングアプローチ、および自動で堅牢な機能次元均一化方法、Deepreを提案します。酵素シーケンスから手動で作成された機能を抽出する代わりに、モデルは生のシーケンスを入力としてエンコードし、分類結果に基づいて生のエンコードから畳み込みと順次の特徴を抽出し、予測パフォーマンスを直接改善します。2つの大規模なデータセットで行われた徹底的な相互倍率検証実験は、Deepreが以前の最先端の方法で予測パフォーマンスを改善することを示しています。さらに、当社のサーバーは、別の低浸透量データセット上の酵素のメインクラスを決定する際に、他の5つのサーバーを上回ります。2つのケーススタディは、酵素アイソフォームの機能的違いを捉えるDeepreの能力を示しています。 可用性と実装:サーバーはhttp://www.cbrc.kaust.edu.sa/deepreで自由にアクセスできます。 連絡先:xin.gao@kaust.edu.sa。 補足情報:補足データは、バイオインフォマティクスオンラインで入手できます。

MOTIVATION: Annotation of enzyme function has a broad range of applications, such as metagenomics, industrial biotechnology, and diagnosis of enzyme deficiency-caused diseases. However, the time and resource required make it prohibitively expensive to experimentally determine the function of every enzyme. Therefore, computational enzyme function prediction has become increasingly important. In this paper, we develop such an approach, determining the enzyme function by predicting the Enzyme Commission number. RESULTS: We propose an end-to-end feature selection and classification model training approach, as well as an automatic and robust feature dimensionality uniformization method, DEEPre, in the field of enzyme function prediction. Instead of extracting manually crafted features from enzyme sequences, our model takes the raw sequence encoding as inputs, extracting convolutional and sequential features from the raw encoding based on the classification result to directly improve the prediction performance. The thorough cross-fold validation experiments conducted on two large-scale datasets show that DEEPre improves the prediction performance over the previous state-of-the-art methods. In addition, our server outperforms five other servers in determining the main class of enzymes on a separate low-homology dataset. Two case studies demonstrate DEEPre's ability to capture the functional difference of enzyme isoforms. AVAILABILITY AND IMPLEMENTATION: The server could be accessed freely at http://www.cbrc.kaust.edu.sa/DEEPre. CONTACT: xin.gao@kaust.edu.sa. SUPPLEMENTARY INFORMATION: Supplementary data are available at Bioinformatics online.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google