Loading...
Genome biology20070101Vol.8issue(7)

非常に並列DNAの精度と品質

,
,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, N.I.H., Extramural
  • Research Support, Non-U.S. Gov't
  • Research Support, U.S. Gov't, Non-P.H.S.
  • Validation Study
概要
Abstract

背景:Roche GS20の公開されているベースあたりの精度はわずか96%ですが、非常に並行してパイロシーケンシングシステムがDNAシーケンスの効率を向上させました。ゲノムプロジェクトでは、非常に冗長コンセンサスアセンブリがシーケンスエラーを補うことができます。対照的に、リボソームRNA遺伝子(RDNA)または他の保存された遺伝子ファミリーのPCRアンプリコンの違いをカタログ化する微生物の多様性の研究は、コンセンサスアセンブリを利用して誤った基本呼び出しを検出および最小化することはできません。 結果:クローン化された微生物リボソームDNA(TAGシーケンス)のV6過可変領域の配列を使用して、Roche GS20システムのベースあたり誤差率の経験的研究を実施しました。組み立てられていないシーケンスで99.5%の精度率を計算し、少量の低品質の読み取りを除去するために使用できるいくつかの要因を特定し、精度を99.75%以上に改善しました。 結論:客観的な基準を使用して低品質のデータを排除することにより、分子生態学的アプリケーションの個々のGS20シーケンス読み取りの品質は、従来の毛細血管法の精度を上回ることができます。

背景:Roche GS20の公開されているベースあたりの精度はわずか96%ですが、非常に並行してパイロシーケンシングシステムがDNAシーケンスの効率を向上させました。ゲノムプロジェクトでは、非常に冗長コンセンサスアセンブリがシーケンスエラーを補うことができます。対照的に、リボソームRNA遺伝子(RDNA)または他の保存された遺伝子ファミリーのPCRアンプリコンの違いをカタログ化する微生物の多様性の研究は、コンセンサスアセンブリを利用して誤った基本呼び出しを検出および最小化することはできません。 結果:クローン化された微生物リボソームDNA(TAGシーケンス)のV6過可変領域の配列を使用して、Roche GS20システムのベースあたり誤差率の経験的研究を実施しました。組み立てられていないシーケンスで99.5%の精度率を計算し、少量の低品質の読み取りを除去するために使用できるいくつかの要因を特定し、精度を99.75%以上に改善しました。 結論:客観的な基準を使用して低品質のデータを排除することにより、分子生態学的アプリケーションの個々のGS20シーケンス読み取りの品質は、従来の毛細血管法の精度を上回ることができます。

BACKGROUND: Massively parallel pyrosequencing systems have increased the efficiency of DNA sequencing, although the published per-base accuracy of a Roche GS20 is only 96%. In genome projects, highly redundant consensus assemblies can compensate for sequencing errors. In contrast, studies of microbial diversity that catalogue differences between PCR amplicons of ribosomal RNA genes (rDNA) or other conserved gene families cannot take advantage of consensus assemblies to detect and minimize incorrect base calls. RESULTS: We performed an empirical study of the per-base error rate for the Roche GS20 system using sequences of the V6 hypervariable region from cloned microbial ribosomal DNA (tag sequencing). We calculated a 99.5% accuracy rate in unassembled sequences, and identified several factors that can be used to remove a small percentage of low-quality reads, improving the accuracy to 99.75% or better. CONCLUSION: By using objective criteria to eliminate low quality data, the quality of individual GS20 sequence reads in molecular ecological applications can surpass the accuracy of traditional capillary methods.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google