著名医師による解説が無料で読めます
すると翻訳の精度が向上します
背景:VSearchは、メタゲノミクス、ゲノミクス、および集団ゲノミクスヌクレオチド配列データを処理および準備するためのオープンソースで無料でマルチスレッド64ビットツールです。ソースコードが公開されていない広く使用されているUsearch Tool(Edgar、2010)の代替として設計されています。アルゴリズムの詳細は実証的に記述されており、メモリ固定された32ビットバージョンのみが自由に利用可能です。。 方法:ヌクレオチド配列を検索する場合、vSearchは、クエリとターゲットシーケンスによって共有された単語に基づいて高速ヒューリスティックを使用して、同様のシーケンスを迅速に識別するために、おそらくUSearchで同様の戦略が使用されます。VSearchは、USearchが使用するシードと拡張ヒューリスティックの代わりに完全な動的プログラミングを使用して、潜在的なターゲットシーケンスに対するクエリの最適なグローバルシーケンスアラインメントを実行します。ペアワイズアラインメントは、ベクトル化と複数のスレッドを使用して並行して計算されます。 結果:vSearchには、USEarchバージョン7で利用可能なヌクレオチド配列を分析するためのほとんどのコマンドが含まれます。検索(正確またはグローバルアライメントに基づいて)、類似性によるクラスタリング(長さの事前ソルティング、豊富な事前ソートを使用して、検索(正確またはグローバルアライメントに基づいて)を含むUsearchバージョン8で利用可能なコマンドのいくつかまたはユーザー定義の注文)、キメラ検出(参照ベースまたはde novo)、控除(フルレングスまたはプレフィックス)、ペアワイズアライメント、逆補完、並べ替え、サブサンプリング。vSearchには、FastQファイル処理のコマンド、つまりフォーマット検出、フィルタリング、読み取り品質統計、およびペアの読み取りのマージも含まれます。さらに、vSearchは、シャッフル、再複雑さ、よく知られているダストアルゴリズムを備えた低複雑度シーケンスのマスキング、異なる類似性定義の選択、FastQファイル形式の変換など、いくつかの新しいコマンドと改善で機能を拡張します。ここでは、検索、クラスタリング、キメラ検出、サブサンプリングを実行する際に、usearchよりも正確であることが示されています。vSearchは、クラスタリングおよびキメラ検出を実行するときにusearchよりも遅くなりますが、ペアリングエンドの読み取りを実行すると、マージと逆流を読み取ると大幅に速くなります。VSearchは、BSD 2-ClauseライセンスまたはGNU General Public Licenseバージョン3.0のいずれかで、https://github.com/torognes/vsearchで入手できます。 ディスカッション:VSearchは、usearchの高速で正確で本格的な代替品であることが示されています。シーケンス分析用の無料でオープンソースの汎用性の高いツールが、メタゲノミクスコミュニティが利用できるようになりました。
背景:VSearchは、メタゲノミクス、ゲノミクス、および集団ゲノミクスヌクレオチド配列データを処理および準備するためのオープンソースで無料でマルチスレッド64ビットツールです。ソースコードが公開されていない広く使用されているUsearch Tool(Edgar、2010)の代替として設計されています。アルゴリズムの詳細は実証的に記述されており、メモリ固定された32ビットバージョンのみが自由に利用可能です。。 方法:ヌクレオチド配列を検索する場合、vSearchは、クエリとターゲットシーケンスによって共有された単語に基づいて高速ヒューリスティックを使用して、同様のシーケンスを迅速に識別するために、おそらくUSearchで同様の戦略が使用されます。VSearchは、USearchが使用するシードと拡張ヒューリスティックの代わりに完全な動的プログラミングを使用して、潜在的なターゲットシーケンスに対するクエリの最適なグローバルシーケンスアラインメントを実行します。ペアワイズアラインメントは、ベクトル化と複数のスレッドを使用して並行して計算されます。 結果:vSearchには、USEarchバージョン7で利用可能なヌクレオチド配列を分析するためのほとんどのコマンドが含まれます。検索(正確またはグローバルアライメントに基づいて)、類似性によるクラスタリング(長さの事前ソルティング、豊富な事前ソートを使用して、検索(正確またはグローバルアライメントに基づいて)を含むUsearchバージョン8で利用可能なコマンドのいくつかまたはユーザー定義の注文)、キメラ検出(参照ベースまたはde novo)、控除(フルレングスまたはプレフィックス)、ペアワイズアライメント、逆補完、並べ替え、サブサンプリング。vSearchには、FastQファイル処理のコマンド、つまりフォーマット検出、フィルタリング、読み取り品質統計、およびペアの読み取りのマージも含まれます。さらに、vSearchは、シャッフル、再複雑さ、よく知られているダストアルゴリズムを備えた低複雑度シーケンスのマスキング、異なる類似性定義の選択、FastQファイル形式の変換など、いくつかの新しいコマンドと改善で機能を拡張します。ここでは、検索、クラスタリング、キメラ検出、サブサンプリングを実行する際に、usearchよりも正確であることが示されています。vSearchは、クラスタリングおよびキメラ検出を実行するときにusearchよりも遅くなりますが、ペアリングエンドの読み取りを実行すると、マージと逆流を読み取ると大幅に速くなります。VSearchは、BSD 2-ClauseライセンスまたはGNU General Public Licenseバージョン3.0のいずれかで、https://github.com/torognes/vsearchで入手できます。 ディスカッション:VSearchは、usearchの高速で正確で本格的な代替品であることが示されています。シーケンス分析用の無料でオープンソースの汎用性の高いツールが、メタゲノミクスコミュニティが利用できるようになりました。
BACKGROUND: VSEARCH is an open source and free of charge multithreaded 64-bit tool for processing and preparing metagenomics, genomics and population genomics nucleotide sequence data. It is designed as an alternative to the widely used USEARCH tool (Edgar, 2010) for which the source code is not publicly available, algorithm details are only rudimentarily described, and only a memory-confined 32-bit version is freely available for academic use. METHODS: When searching nucleotide sequences, VSEARCH uses a fast heuristic based on words shared by the query and target sequences in order to quickly identify similar sequences, a similar strategy is probably used in USEARCH. VSEARCH then performs optimal global sequence alignment of the query against potential target sequences, using full dynamic programming instead of the seed-and-extend heuristic used by USEARCH. Pairwise alignments are computed in parallel using vectorisation and multiple threads. RESULTS: VSEARCH includes most commands for analysing nucleotide sequences available in USEARCH version 7 and several of those available in USEARCH version 8, including searching (exact or based on global alignment), clustering by similarity (using length pre-sorting, abundance pre-sorting or a user-defined order), chimera detection (reference-based or de novo), dereplication (full length or prefix), pairwise alignment, reverse complementation, sorting, and subsampling. VSEARCH also includes commands for FASTQ file processing, i.e., format detection, filtering, read quality statistics, and merging of paired reads. Furthermore, VSEARCH extends functionality with several new commands and improvements, including shuffling, rereplication, masking of low-complexity sequences with the well-known DUST algorithm, a choice among different similarity definitions, and FASTQ file format conversion. VSEARCH is here shown to be more accurate than USEARCH when performing searching, clustering, chimera detection and subsampling, while on a par with USEARCH for paired-ends read merging. VSEARCH is slower than USEARCH when performing clustering and chimera detection, but significantly faster when performing paired-end reads merging and dereplication. VSEARCH is available at https://github.com/torognes/vsearch under either the BSD 2-clause license or the GNU General Public License version 3.0. DISCUSSION: VSEARCH has been shown to be a fast, accurate and full-fledged alternative to USEARCH. A free and open-source versatile tool for sequence analysis is now available to the metagenomics community.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。