Loading...
Journal of chemical information and modeling2018Jun25Vol.58issue(6)

反応指紋と機械学習方法を使用した、酸化還元酵素およびヒドロラーゼの酵素反応の多分類予測

,
,
,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

薬物代謝は、酵素的に触媒された一連の反応を含む、人体の複雑な手順です。ただし、薬物代謝を実験的に調査するのは費用と時間がかかります。したがって、計算方法は、薬物代謝を予測するために開発されており、大きな利点を示しています。最初のステップとして、代謝反応と酵素の分類は、薬物代謝予測に非常に望ましいものです。この研究では、酸化還元酵素とヒドロラーゼによって触媒される反応型の予測のための多分類モデルを開発しました。このモデルビルディングには、反応を記述するために3つの反応指紋を使用し、7つの機械学習アルゴリズムが使用されました。1055の加水分解と2510の酸化還元反応を含むKEGGから取得したデータを、それぞれモデルの構築に使用しました。外部検証データは、RHEAデータベースから抽出された213の加水分解と512の酸化還元反応で構成されていました。最高のモデルは、2048ビット変換反応指紋を使用して、ニューラルネットワークまたはロジスティック回帰によって構築されました。メインクラス、サブクラス、および外部検証セットのスーパークラス分類モデルの予測精度はすべて90%を超えていました。この研究は、酵素反応注釈と代謝予測に関するさらなる研究に非常に役立ちます。

薬物代謝は、酵素的に触媒された一連の反応を含む、人体の複雑な手順です。ただし、薬物代謝を実験的に調査するのは費用と時間がかかります。したがって、計算方法は、薬物代謝を予測するために開発されており、大きな利点を示しています。最初のステップとして、代謝反応と酵素の分類は、薬物代謝予測に非常に望ましいものです。この研究では、酸化還元酵素とヒドロラーゼによって触媒される反応型の予測のための多分類モデルを開発しました。このモデルビルディングには、反応を記述するために3つの反応指紋を使用し、7つの機械学習アルゴリズムが使用されました。1055の加水分解と2510の酸化還元反応を含むKEGGから取得したデータを、それぞれモデルの構築に使用しました。外部検証データは、RHEAデータベースから抽出された213の加水分解と512の酸化還元反応で構成されていました。最高のモデルは、2048ビット変換反応指紋を使用して、ニューラルネットワークまたはロジスティック回帰によって構築されました。メインクラス、サブクラス、および外部検証セットのスーパークラス分類モデルの予測精度はすべて90%を超えていました。この研究は、酵素反応注釈と代謝予測に関するさらなる研究に非常に役立ちます。

Drug metabolism is a complex procedure in the human body, including a series of enzymatically catalyzed reactions. However, it is costly and time consuming to investigate drug metabolism experimentally; computational methods are hence developed to predict drug metabolism and have shown great advantages. As the first step, classification of metabolic reactions and enzymes is highly desirable for drug metabolism prediction. In this study, we developed multiclassification models for prediction of reaction types catalyzed by oxidoreductases and hydrolases, in which three reaction fingerprints were used to describe the reactions and seven machine learnings algorithms were employed for model building. Data retrieved from KEGG containing 1055 hydrolysis and 2510 redox reactions were used to build the models, respectively. The external validation data consisted of 213 hydrolysis and 512 redox reactions extracted from the Rhea database. The best models were built by neural network or logistic regression with a 2048-bit transformation reaction fingerprint. The predictive accuracies of the main class, subclass, and superclass classification models on external validation sets were all above 90%. This study will be very helpful for enzymatic reaction annotation and further study on metabolism prediction.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google