Loading...
Protein science : a publication of the Protein Society2004Jun01Vol.13issue(6)

スコアリングプロファイルからプロファイルのシーケンスアライメント

,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
  • Research Support, U.S. Gov't, P.H.S.
概要
Abstract

シーケンスアライメントプロファイルは、正確なシーケンスアライメントを作成する上で非常に強力であることが示されています。プロファイルは、ローカルアライメントアルゴリズムを使用してシーケンスデータベースを検索するためによく使用されます。より正確で長いアラインメントが、プロファイルとプロファイルの比較により取得されています。プロファイルプロファイルアライメントを作成する際に実行する必要があるいくつかの手順があり、それぞれにパラメーターとアルゴリズムの選択を伴います。これらの手順には、(1)各プロファイルを構築するために使用される複数のアラインメントに含めるシーケンス、(2)複数のアライメントで同様のシーケンスを重み付けする方法、および加重アライメントからアミノ酸周波数を決定する方法(3)1つのプロファイルからの列が他のプロファイルの列に合わせた列、(4)プロファイルプロファイルアライメントのギャップを獲得する方法、および(5)構造情報を含める方法。構造的に決定された配列アラインメントを備えた相同タンパク質のペアで構成される大規模ベンチマークは、各スコアリングスキームの有効性を評価するために必要です。このようなベンチマークにより、プロファイルプロファイルアライメントの特性を調査し、(1)最適化されたギャップペナルティで、ほとんどの列列スコアリング関数はアライメント精度で互いに同様に動作することがわかりました。(2)ただし、一部の機能は、検索感度と特異性がはるかに高い。(3)複数のシーケンスアライメントのカラムのアミノ酸数を決定する際の位置固有の重み付けスキームは、配列固有のスキームよりも優れています。(4)クエリシーケンスにギャップがあるプロファイル内の位置を削除すると、より良いアラインメントが得られます。(5)予測された既知の二次構造情報を追加すると、アラインメントが向上します。

シーケンスアライメントプロファイルは、正確なシーケンスアライメントを作成する上で非常に強力であることが示されています。プロファイルは、ローカルアライメントアルゴリズムを使用してシーケンスデータベースを検索するためによく使用されます。より正確で長いアラインメントが、プロファイルとプロファイルの比較により取得されています。プロファイルプロファイルアライメントを作成する際に実行する必要があるいくつかの手順があり、それぞれにパラメーターとアルゴリズムの選択を伴います。これらの手順には、(1)各プロファイルを構築するために使用される複数のアラインメントに含めるシーケンス、(2)複数のアライメントで同様のシーケンスを重み付けする方法、および加重アライメントからアミノ酸周波数を決定する方法(3)1つのプロファイルからの列が他のプロファイルの列に合わせた列、(4)プロファイルプロファイルアライメントのギャップを獲得する方法、および(5)構造情報を含める方法。構造的に決定された配列アラインメントを備えた相同タンパク質のペアで構成される大規模ベンチマークは、各スコアリングスキームの有効性を評価するために必要です。このようなベンチマークにより、プロファイルプロファイルアライメントの特性を調査し、(1)最適化されたギャップペナルティで、ほとんどの列列スコアリング関数はアライメント精度で互いに同様に動作することがわかりました。(2)ただし、一部の機能は、検索感度と特異性がはるかに高い。(3)複数のシーケンスアライメントのカラムのアミノ酸数を決定する際の位置固有の重み付けスキームは、配列固有のスキームよりも優れています。(4)クエリシーケンスにギャップがあるプロファイル内の位置を削除すると、より良いアラインメントが得られます。(5)予測された既知の二次構造情報を追加すると、アラインメントが向上します。

Sequence alignment profiles have been shown to be very powerful in creating accurate sequence alignments. Profiles are often used to search a sequence database with a local alignment algorithm. More accurate and longer alignments have been obtained with profile-to-profile comparison. There are several steps that must be performed in creating profile-profile alignments, and each involves choices in parameters and algorithms. These steps include (1) what sequences to include in a multiple alignment used to build each profile, (2) how to weight similar sequences in the multiple alignment and how to determine amino acid frequencies from the weighted alignment, (3) how to score a column from one profile aligned to a column of the other profile, (4) how to score gaps in the profile-profile alignment, and (5) how to include structural information. Large-scale benchmarks consisting of pairs of homologous proteins with structurally determined sequence alignments are necessary for evaluating the efficacy of each scoring scheme. With such a benchmark, we have investigated the properties of profile-profile alignments and found that (1) with optimized gap penalties, most column-column scoring functions behave similarly to one another in alignment accuracy; (2) some functions, however, have much higher search sensitivity and specificity; (3) position-specific weighting schemes in determining amino acid counts in columns of multiple sequence alignments are better than sequence-specific schemes; (4) removing positions in the profile with gaps in the query sequence results in better alignments; and (5) adding predicted and known secondary structure information improves alignments.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google