Loading...
Bioinformatics (Oxford, England)2004Jun12Vol.20issue(9)

align-m--非常に発散するシーケンスの複数のアライメントのための新しいアルゴリズム

,
,
,
文献タイプ:
  • Comparative Study
  • Evaluation Study
  • Journal Article
  • Research Support, Non-U.S. Gov't
  • Validation Study
概要
Abstract

動機:非常に多様なシーケンスの複数のアラインメントは、利用可能なプログラムがパフォーマンスの低下を示す傾向がある挑戦的な問題です。一般的に、これは、生物学的現実を十分に正確に説明しないスコアリング機能、またはソリューションスペースを効率的に探索できないヒューリスティックによるものです。この点で、非進行のローカルアプローチを使用してグローバルなアライメントを導く新しいプログラムAlign-Mを提示します。 結果:SCOP分類全体を表す2つの大きなテストセットと、0〜50%の同一性の間のシーケンスの類似性をカバーしました。パフォーマンスは、一般に利用可能なアルゴリズムClustalw、T-Coffee、およびdialと比較されました。一般に、Align-Mは、特に遠い関連するシーケンスについて、正しく整列した残基に関して同等の精度またはわずかに高い精度を持っています。重要なことに、他のアルゴリズムの一部と比較して、平均差が15%以上の平均差で、はるかに少ない残基を整列させることです。 可用性:Align-Mとテストセットはhttp://bioinformatics.vub.ac.beで入手できます

動機:非常に多様なシーケンスの複数のアラインメントは、利用可能なプログラムがパフォーマンスの低下を示す傾向がある挑戦的な問題です。一般的に、これは、生物学的現実を十分に正確に説明しないスコアリング機能、またはソリューションスペースを効率的に探索できないヒューリスティックによるものです。この点で、非進行のローカルアプローチを使用してグローバルなアライメントを導く新しいプログラムAlign-Mを提示します。 結果:SCOP分類全体を表す2つの大きなテストセットと、0〜50%の同一性の間のシーケンスの類似性をカバーしました。パフォーマンスは、一般に利用可能なアルゴリズムClustalw、T-Coffee、およびdialと比較されました。一般に、Align-Mは、特に遠い関連するシーケンスについて、正しく整列した残基に関して同等の精度またはわずかに高い精度を持っています。重要なことに、他のアルゴリズムの一部と比較して、平均差が15%以上の平均差で、はるかに少ない残基を整列させることです。 可用性:Align-Mとテストセットはhttp://bioinformatics.vub.ac.beで入手できます

MOTIVATION: Multiple alignment of highly divergent sequences is a challenging problem for which available programs tend to show poor performance. Generally, this is due to a scoring function that does not describe biological reality accurately enough or a heuristic that cannot explore solution space efficiently enough. In this respect, we present a new program, Align-m, that uses a non-progressive local approach to guide a global alignment. RESULTS: Two large test sets were used that represent the entire SCOP classification and cover sequence similarities between 0 and 50% identity. Performance was compared with the publicly available algorithms ClustalW, T-Coffee and DiAlign. In general, Align-m has comparable or slightly higher accuracy in terms of correctly aligned residues, especially for distantly related sequences. Importantly, it aligns much fewer residues incorrectly, with average differences of over 15% compared with some of the other algorithms. AVAILABILITY: Align-m and the test sets are available at http://bioinformatics.vub.ac.be

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google