Loading...
Nucleic acids research20050101Vol.33issue(2)

MAFFTバージョン5:複数のシーケンスアライメントの精度の改善

,
,
,
,
文献タイプ:
  • Evaluation Study
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

複数のシーケンスアライメントプログラムMAFFTの精度が改善されました。MAFFTの新しいバージョン(5.3)は、新しい反復改良オプションであるH-Ins-I、F-ins-I、G-Ins-Iを提供します。この場合、ペアワイズアラインメント情報が客観的関数に組み込まれます。MAFFTのこれらの新しいオプションは、50を超えるシーケンスのアラインメントで構成されるベンチマークテストでTCOFFEEバージョン2やClustal Wを含む、現在利用可能な方法よりも高い精度を示しました。以前に利用可能なオプションと同様に、MAFFTの新しいオプションは、標準のデスクトップコンピューターで何百ものシーケンスを処理できます。また、アラインメントに含まれるホモログの数の効果を調べました。類似性が低い約8シーケンスで構成される複数のアライメントの場合、シーケンスが数十の密接なホモログ(E-Value <10(-5)-10( - )と一緒に整列したときに精度が向上しました(2〜10パーセントポイント)20))データベースから収集。このような改善は、ほとんどの方法で一般的に観察されましたが、ここで提案されているMAFFTの新しいオプションについては著しく大きくなっています。したがって、ncbi-blastを使用してSwissprotから収集された密接なホモログと一緒に入力シーケンスを揃えるRubyスクリプトMaffte.rbを作成しました。

複数のシーケンスアライメントプログラムMAFFTの精度が改善されました。MAFFTの新しいバージョン(5.3)は、新しい反復改良オプションであるH-Ins-I、F-ins-I、G-Ins-Iを提供します。この場合、ペアワイズアラインメント情報が客観的関数に組み込まれます。MAFFTのこれらの新しいオプションは、50を超えるシーケンスのアラインメントで構成されるベンチマークテストでTCOFFEEバージョン2やClustal Wを含む、現在利用可能な方法よりも高い精度を示しました。以前に利用可能なオプションと同様に、MAFFTの新しいオプションは、標準のデスクトップコンピューターで何百ものシーケンスを処理できます。また、アラインメントに含まれるホモログの数の効果を調べました。類似性が低い約8シーケンスで構成される複数のアライメントの場合、シーケンスが数十の密接なホモログ(E-Value <10(-5)-10( - )と一緒に整列したときに精度が向上しました(2〜10パーセントポイント)20))データベースから収集。このような改善は、ほとんどの方法で一般的に観察されましたが、ここで提案されているMAFFTの新しいオプションについては著しく大きくなっています。したがって、ncbi-blastを使用してSwissprotから収集された密接なホモログと一緒に入力シーケンスを揃えるRubyスクリプトMaffte.rbを作成しました。

The accuracy of multiple sequence alignment program MAFFT has been improved. The new version (5.3) of MAFFT offers new iterative refinement options, H-INS-i, F-INS-i and G-INS-i, in which pairwise alignment information are incorporated into objective function. These new options of MAFFT showed higher accuracy than currently available methods including TCoffee version 2 and CLUSTAL W in benchmark tests consisting of alignments of >50 sequences. Like the previously available options, the new options of MAFFT can handle hundreds of sequences on a standard desktop computer. We also examined the effect of the number of homologues included in an alignment. For a multiple alignment consisting of approximately 8 sequences with low similarity, the accuracy was improved (2-10 percentage points) when the sequences were aligned together with dozens of their close homologues (E-value < 10(-5)-10(-20)) collected from a database. Such improvement was generally observed for most methods, but remarkably large for the new options of MAFFT proposed here. Thus, we made a Ruby script, mafftE.rb, which aligns the input sequences together with their close homologues collected from SwissProt using NCBI-BLAST.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google