Loading...
Bioinformatics (Oxford, England)2005May01Vol.21issue(9)

GMAP:mRNAおよびESTシーケンスのゲノムマッピングおよびアライメントプログラム

,
,
文献タイプ:
  • Evaluation Study
  • Journal Article
概要
Abstract

動機:cDNAシーケンスをゲノムにマッピングして整列させるためのスタンドアロンプログラムであるGMAPを紹介します。プログラムは、最小限の起動時間とメモリ要件を単一のシーケンスをマップおよび整列させ、大きなシーケンスセットの高速バッチ処理を提供します。このプログラムは、確率的スプライス部位モデルを使用せずに、実質的な多型と配列エラーが存在する場合でも、正確な遺伝子構造を生成します。プログラムの根底にある方法論には、ゲノムマッピングのための最小限のサンプリング戦略、おおよそのアライメントのためのオリゴマーチェーン、スプライス部位検出のためのサンドイッチDP、および統計的有意性テストのマイクロエキソン同定が含まれます。 結果:1%と3%のレートでランダム変異を持つヒトメッセンジャーRNAのセットでは、GMAPはすべてのスプライスサイトをシーケンスの99.3%以上で正確に識別しました。これは、既存のプログラムのエラー率の10分の1でした。人間の表現されたシーケンスタグの大きなセットで、GMAPはBLATよりも頻繁に高品質のアライメントを提供しました。シロイヌナズナのcdnasのセットでは、GMAPはGeneseqerと同等に機能しました。これらの実験では、GMAPは既存のプログラムよりも速度が数倍増加することを示しました。 可用性:GMAPおよび関連プログラムのソースコードはhttp://www.gene.com/share/gmapで入手できます 補足情報:http://www.gene.com/share/gmap。

動機:cDNAシーケンスをゲノムにマッピングして整列させるためのスタンドアロンプログラムであるGMAPを紹介します。プログラムは、最小限の起動時間とメモリ要件を単一のシーケンスをマップおよび整列させ、大きなシーケンスセットの高速バッチ処理を提供します。このプログラムは、確率的スプライス部位モデルを使用せずに、実質的な多型と配列エラーが存在する場合でも、正確な遺伝子構造を生成します。プログラムの根底にある方法論には、ゲノムマッピングのための最小限のサンプリング戦略、おおよそのアライメントのためのオリゴマーチェーン、スプライス部位検出のためのサンドイッチDP、および統計的有意性テストのマイクロエキソン同定が含まれます。 結果:1%と3%のレートでランダム変異を持つヒトメッセンジャーRNAのセットでは、GMAPはすべてのスプライスサイトをシーケンスの99.3%以上で正確に識別しました。これは、既存のプログラムのエラー率の10分の1でした。人間の表現されたシーケンスタグの大きなセットで、GMAPはBLATよりも頻繁に高品質のアライメントを提供しました。シロイヌナズナのcdnasのセットでは、GMAPはGeneseqerと同等に機能しました。これらの実験では、GMAPは既存のプログラムよりも速度が数倍増加することを示しました。 可用性:GMAPおよび関連プログラムのソースコードはhttp://www.gene.com/share/gmapで入手できます 補足情報:http://www.gene.com/share/gmap。

MOTIVATION: We introduce GMAP, a standalone program for mapping and aligning cDNA sequences to a genome. The program maps and aligns a single sequence with minimal startup time and memory requirements, and provides fast batch processing of large sequence sets. The program generates accurate gene structures, even in the presence of substantial polymorphisms and sequence errors, without using probabilistic splice site models. Methodology underlying the program includes a minimal sampling strategy for genomic mapping, oligomer chaining for approximate alignment, sandwich DP for splice site detection, and microexon identification with statistical significance testing. RESULTS: On a set of human messenger RNAs with random mutations at a 1 and 3% rate, GMAP identified all splice sites accurately in over 99.3% of the sequences, which was one-tenth the error rate of existing programs. On a large set of human expressed sequence tags, GMAP provided higher-quality alignments more often than blat did. On a set of Arabidopsis cDNAs, GMAP performed comparably with GeneSeqer. In these experiments, GMAP demonstrated a several-fold increase in speed over existing programs. AVAILABILITY: Source code for gmap and associated programs is available at http://www.gene.com/share/gmap SUPPLEMENTARY INFORMATION: http://www.gene.com/share/gmap.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google