Loading...
Journal of molecular biology2000Mar10Vol.296issue(5)

スレッドのポテンシャルとシーケンスプロファイルの組み合わせにより、倍率認識が向上します

,
,
,
文献タイプ:
  • Journal Article
  • Research Support, U.S. Gov't, P.H.S.
概要
Abstract

構造的に類似したタンパク質のベンチマークセットを使用して、接触ポテンシャルとシーケンスプロファイル用語の最適な組み合わせでスコアリング機能を識別することを目的とした一連のスレッド実験を実施します。ベンチマークセットは、多くの中程度のfictultyフォールド認識ターゲットを含むように選択されます。ここでは、シーケンスの類似性はBLASTによって検出できませんが、構造的類似性は広範です。接触電位は、ランダムに圧縮された構造とは対照的に、ネイティブで、異なるアミノ酸ペアを含む非ローカルコンタクトの対数ODDに基づいています。シーケンスプロファイル用語は、PSI-Blastで使用されるものです。これらの用語の組み合わせにより、認識感度とスレッドモデルの精度の両方に関して、いずれかの用語のみの使用に対する倍数認識の成功率が大幅に向上することがわかります。改善は、10%から20%のシーケンスアイデンティティと60%から80%の重ね合わせ可能な残基の間のターゲットで最大であり、臨界精度と有意なしきい値を倍増するモデルの数が2倍以上です。これらの改善は、CASP3での合計スコアリング機能のパフォーマンスの成功を説明することをお勧めします。シーケンスプロファイルと接触ポテンシャルの用語が補完的に見える理由について考えられる説明について説明します。

構造的に類似したタンパク質のベンチマークセットを使用して、接触ポテンシャルとシーケンスプロファイル用語の最適な組み合わせでスコアリング機能を識別することを目的とした一連のスレッド実験を実施します。ベンチマークセットは、多くの中程度のfictultyフォールド認識ターゲットを含むように選択されます。ここでは、シーケンスの類似性はBLASTによって検出できませんが、構造的類似性は広範です。接触電位は、ランダムに圧縮された構造とは対照的に、ネイティブで、異なるアミノ酸ペアを含む非ローカルコンタクトの対数ODDに基づいています。シーケンスプロファイル用語は、PSI-Blastで使用されるものです。これらの用語の組み合わせにより、認識感度とスレッドモデルの精度の両方に関して、いずれかの用語のみの使用に対する倍数認識の成功率が大幅に向上することがわかります。改善は、10%から20%のシーケンスアイデンティティと60%から80%の重ね合わせ可能な残基の間のターゲットで最大であり、臨界精度と有意なしきい値を倍増するモデルの数が2倍以上です。これらの改善は、CASP3での合計スコアリング機能のパフォーマンスの成功を説明することをお勧めします。シーケンスプロファイルと接触ポテンシャルの用語が補完的に見える理由について考えられる説明について説明します。

Using a benchmark set of structurally similar proteins, we conduct a series of threading experiments intended to identify a scoring function with an optimal combination of contact-potential and sequence-profile terms. The benchmark set is selected to include many medium-difficulty fold recognition targets, where sequence similarity is undetectable by BLAST but structural similarity is extensive. The contact potential is based on the log-odds of non-local contacts involving different amino acid pairs, in native as opposed to randomly compacted structures. The sequence profile term is that used in PSI-BLAST. We find that combination of these terms significantly improves the success rate of fold recognition over use of either term alone, with respect to both recognition sensitivity and the accuracy of threading models. Improvement is greatest for targets between 10 % and 20 % sequence identity and 60 % to 80 % superimposable residues, where the number of models crossing critical accuracy and significance thresholds more than doubles. We suggest that these improvements account for the successful performance of the combined scoring function at CASP3. We discuss possible explanations as to why sequence-profile and contact-potential terms appear complementary.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google