Loading...
International journal of molecular sciences2018Apr13Vol.19issue(4)

IAPSL-IF:アミノ酸配列からキャプチャされた統合的な特徴を使用したアポトーシスタンパク質細胞の位置の識別

,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

アポトーシスタンパク質(APS)は、細胞増殖と死のバランスを調節することにより、正常な組織恒常性を制御します。APSの機能は、細胞内の位置に強く関連しています。現在までに、APの細胞内位置を確実に識別する計算方法が報告されていますが、予測精度を改善する余地がまだあります。この研究では、Markov Chains、物理化学的特性マトリックス、および位置固有のスコアマトリックス(PSSM)からキャプチャされた統合的な特徴に基づいたIapsl-IF(アポトーシスタンパク質細胞内統合特徴の識別)という名前の新しい方法を開発しました。アミノ酸配列。異なる長さのマトリックスは、自動クロスカランス(ACC)メソッドを使用して、固定長の特徴ベクトルに変換されました。特徴の最適なサブセットは、再帰機能除去(RFE)アルゴリズム法を使用して選択され、これらの機能を備えたシーケンスは、サポートベクターマシン(SVM)分類子によってトレーニングされました。3つのデータセットZD98、CL317、およびZW225に基づいて、IAPSL-IFはJackKnifeの交差検定テストを使用して検査されました。結果のデータは、IAPSL-IFが文献で報告されている既知の予測因子よりも優れていることを示しました。3つのデータセットの全体的な精度は、それぞれ98.98%(ZD98)、94.95%(CL317)、および97.33%(ZW225)でした。データセットのマシューズ相関係数、感度、および特異性(膜タンパク質、膜タンパク質、細胞質タンパク質、細胞質網状タンパク質、核タンパク質、核タンパク質、分泌タンパク質)のマシューズ相関係数、感度、および特異性は、0.92-1.0、94.23-100%、および94.23-100%、および94.23-100%、およびそれぞれ97.07-100%。全体として、この研究の結果は、APの細胞内位置をよりよく識別するための高いスループットとシーケンスベースの方法を提供し、生物のプログラムされた細胞死のさらなる理解を促進します。

アポトーシスタンパク質(APS)は、細胞増殖と死のバランスを調節することにより、正常な組織恒常性を制御します。APSの機能は、細胞内の位置に強く関連しています。現在までに、APの細胞内位置を確実に識別する計算方法が報告されていますが、予測精度を改善する余地がまだあります。この研究では、Markov Chains、物理化学的特性マトリックス、および位置固有のスコアマトリックス(PSSM)からキャプチャされた統合的な特徴に基づいたIapsl-IF(アポトーシスタンパク質細胞内統合特徴の識別)という名前の新しい方法を開発しました。アミノ酸配列。異なる長さのマトリックスは、自動クロスカランス(ACC)メソッドを使用して、固定長の特徴ベクトルに変換されました。特徴の最適なサブセットは、再帰機能除去(RFE)アルゴリズム法を使用して選択され、これらの機能を備えたシーケンスは、サポートベクターマシン(SVM)分類子によってトレーニングされました。3つのデータセットZD98、CL317、およびZW225に基づいて、IAPSL-IFはJackKnifeの交差検定テストを使用して検査されました。結果のデータは、IAPSL-IFが文献で報告されている既知の予測因子よりも優れていることを示しました。3つのデータセットの全体的な精度は、それぞれ98.98%(ZD98)、94.95%(CL317)、および97.33%(ZW225)でした。データセットのマシューズ相関係数、感度、および特異性(膜タンパク質、膜タンパク質、細胞質タンパク質、細胞質網状タンパク質、核タンパク質、核タンパク質、分泌タンパク質)のマシューズ相関係数、感度、および特異性は、0.92-1.0、94.23-100%、および94.23-100%、および94.23-100%、およびそれぞれ97.07-100%。全体として、この研究の結果は、APの細胞内位置をよりよく識別するための高いスループットとシーケンスベースの方法を提供し、生物のプログラムされた細胞死のさらなる理解を促進します。

Apoptosis proteins (APs) control normal tissue homeostasis by regulating the balance between cell proliferation and death. The function of APs is strongly related to their subcellular location. To date, computational methods have been reported that reliably identify the subcellular location of APs, however, there is still room for improvement of the prediction accuracy. In this study, we developed a novel method named iAPSL-IF (identification of apoptosis protein subcellular location-integrative features), which is based on integrative features captured from Markov chains, physicochemical property matrices, and position-specific score matrices (PSSMs) of amino acid sequences. The matrices with different lengths were transformed into fixed-length feature vectors using an auto cross-covariance (ACC) method. An optimal subset of the features was chosen using a recursive feature elimination (RFE) algorithm method, and the sequences with these features were trained by a support vector machine (SVM) classifier. Based on three datasets ZD98, CL317, and ZW225, the iAPSL-IF was examined using a jackknife cross-validation test. The resulting data showed that the iAPSL-IF outperformed the known predictors reported in the literature: its overall accuracy on the three datasets was 98.98% (ZD98), 94.95% (CL317), and 97.33% (ZW225), respectively; the Matthews correlation coefficient, sensitivity, and specificity for several classes of subcellular location proteins (e.g., membrane proteins, cytoplasmic proteins, endoplasmic reticulum proteins, nuclear proteins, and secreted proteins) in the datasets were 0.92-1.0, 94.23-100%, and 97.07-100%, respectively. Overall, the results of this study provide a high throughput and sequence-based method for better identification of the subcellular location of APs, and facilitates further understanding of programmed cell death in organisms.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google