Loading...
BMC bioinformatics2019Jul25Vol.20issue(1)

マジックブラスト、長い読み取りと短い読み取り用の正確なRNA-seqアライナー

,
,
,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

背景:次世代シーケンステクノロジーは、転写産物やゲノムから、多くの場合、ペアエンドの数千万人の読み取りを生成できます。しかし、特に長い読み取りでは、ゲノムにRNAを整列させ、イントロンを正確に発見できるプログラムはほとんどありません。Magic Pipelineのアイデアに基づいた新しいアライナーであるMagic-Blastを紹介します。 結果:Magic-Blastは、シード選択中のスプライスされたアライメントスコアの最適化と選択的マスキングを含む革新的な技術を使用します。マジックブラストのパフォーマンスを評価して、短いまたは長いシーケンスを正確にマッピングし、Pacbio、Roche、およびIllumina Runsの実際のRNA-Seqデータセット、および6つのベンチマークでイントロンを発見する能力を評価し、他の一般的なアライナーと比較します。さらに、ゲノムに完全に一致する人間の理想化されたRefSEQ mRNAシーケンスのアラインメントを検討します。 結論:私たちは、マジックブラストが幅広い条件にわたってイントロンディスカバリーで最高であり、マッピングで最高のものは、あらゆるプラットフォームから250を超えるベースを長く読み取ることを示しています。汎用性が高く、高レベルのミスマッチまたは極端なベース組成から堅牢であり、合理的に高速です。読み取りをBLASTデータベースまたはFASTAファイルに合わせることができます。FASTQファイルを入力として受け入れるか、NCBIのSRAリポジトリからアクセッションを自動的に取得できます。

背景:次世代シーケンステクノロジーは、転写産物やゲノムから、多くの場合、ペアエンドの数千万人の読み取りを生成できます。しかし、特に長い読み取りでは、ゲノムにRNAを整列させ、イントロンを正確に発見できるプログラムはほとんどありません。Magic Pipelineのアイデアに基づいた新しいアライナーであるMagic-Blastを紹介します。 結果:Magic-Blastは、シード選択中のスプライスされたアライメントスコアの最適化と選択的マスキングを含む革新的な技術を使用します。マジックブラストのパフォーマンスを評価して、短いまたは長いシーケンスを正確にマッピングし、Pacbio、Roche、およびIllumina Runsの実際のRNA-Seqデータセット、および6つのベンチマークでイントロンを発見する能力を評価し、他の一般的なアライナーと比較します。さらに、ゲノムに完全に一致する人間の理想化されたRefSEQ mRNAシーケンスのアラインメントを検討します。 結論:私たちは、マジックブラストが幅広い条件にわたってイントロンディスカバリーで最高であり、マッピングで最高のものは、あらゆるプラットフォームから250を超えるベースを長く読み取ることを示しています。汎用性が高く、高レベルのミスマッチまたは極端なベース組成から堅牢であり、合理的に高速です。読み取りをBLASTデータベースまたはFASTAファイルに合わせることができます。FASTQファイルを入力として受け入れるか、NCBIのSRAリポジトリからアクセッションを自動的に取得できます。

BACKGROUND: Next-generation sequencing technologies can produce tens of millions of reads, often paired-end, from transcripts or genomes. But few programs can align RNA on the genome and accurately discover introns, especially with long reads. We introduce Magic-BLAST, a new aligner based on ideas from the Magic pipeline. RESULTS: Magic-BLAST uses innovative techniques that include the optimization of a spliced alignment score and selective masking during seed selection. We evaluate the performance of Magic-BLAST to accurately map short or long sequences and its ability to discover introns on real RNA-seq data sets from PacBio, Roche and Illumina runs, and on six benchmarks, and compare it to other popular aligners. Additionally, we look at alignments of human idealized RefSeq mRNA sequences perfectly matching the genome. CONCLUSIONS: We show that Magic-BLAST is the best at intron discovery over a wide range of conditions and the best at mapping reads longer than 250 bases, from any platform. It is versatile and robust to high levels of mismatches or extreme base composition, and reasonably fast. It can align reads to a BLAST database or a FASTA file. It can accept a FASTQ file as input or automatically retrieve an accession from the SRA repository at the NCBI.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google