Loading...
The Indian journal of medical research2020Jan01Vol.151issue(1)

16S RRNAシーケンスデータを使用して、細菌の分類学的分類を改善するための統一されたキュレート参照データベースの構築と評価

,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

背景と目的:細菌群集の分析では、16S RRNA配列は、一般的に使用される3つのデータベース[Greengenes、SilvaおよびRibosomal Database Project(RDP)]のいずれかと比較することにより、分類学的分類にさらされます。3つのデータベースすべてから完全に注釈付きの非冗長シーケンスを含む統一データベースは、16S RRNA配列データの分析中に、より良い分類学的分類を提供する可能性があると仮定されました。したがって、統一された16S RRNAデータベースが構築され、そのパフォーマンスは、4つの異なる分類学的割り当て方法でそれを使用し、16S RRNA遺伝子のさまざまな過可変領域(HVR)のデータについて評価しました。 方法:3つのデータベースからの非ぼやけた完全に注釈付きのフルレングス16S RRNAシーケンスをマージし、分類の割り当てでのパフォーマンスを3つの元のデータベースのそれと比較することにより、統一された16S RRNAデータベース(16S-UDB)を構築しました。これは、4つの異なる分類法の割り当て方法[MothurNaïveBayesian分類器(Mothur-NBC)、RDPナイーブベイジアン分類器(RDP-NBC)、UCLUST、SORTMERNA]および16S RRNAの13領域からのデータを使用して行われました[7つの過変数領域(HVR)(V2-V8)および6組の隣接HVR]。 結果:統一された16S RRNAデータベースには、13,078のフルレングス、完全に注釈付きの16S RRNAシーケンスが含まれていました。TestデータベースのシーケンスのMothur-NBC分類器とV2+V3領域)で使用すると、属と種をより大きな割合(それぞれ90.05および46.82%)に割り当てることができます。それぞれ10.23-24.28%、同じ分類器と領域があります)。 解釈と結論:我々の結果は、細菌混合物の分析のために、16S rRNAのV2-V3領域のシーケンスに続いて、Mothur-NBC分類器と16S-UDBデータベースを使用したデータの分析が優先されることを示しています。

背景と目的:細菌群集の分析では、16S RRNA配列は、一般的に使用される3つのデータベース[Greengenes、SilvaおよびRibosomal Database Project(RDP)]のいずれかと比較することにより、分類学的分類にさらされます。3つのデータベースすべてから完全に注釈付きの非冗長シーケンスを含む統一データベースは、16S RRNA配列データの分析中に、より良い分類学的分類を提供する可能性があると仮定されました。したがって、統一された16S RRNAデータベースが構築され、そのパフォーマンスは、4つの異なる分類学的割り当て方法でそれを使用し、16S RRNA遺伝子のさまざまな過可変領域(HVR)のデータについて評価しました。 方法:3つのデータベースからの非ぼやけた完全に注釈付きのフルレングス16S RRNAシーケンスをマージし、分類の割り当てでのパフォーマンスを3つの元のデータベースのそれと比較することにより、統一された16S RRNAデータベース(16S-UDB)を構築しました。これは、4つの異なる分類法の割り当て方法[MothurNaïveBayesian分類器(Mothur-NBC)、RDPナイーブベイジアン分類器(RDP-NBC)、UCLUST、SORTMERNA]および16S RRNAの13領域からのデータを使用して行われました[7つの過変数領域(HVR)(V2-V8)および6組の隣接HVR]。 結果:統一された16S RRNAデータベースには、13,078のフルレングス、完全に注釈付きの16S RRNAシーケンスが含まれていました。TestデータベースのシーケンスのMothur-NBC分類器とV2+V3領域)で使用すると、属と種をより大きな割合(それぞれ90.05および46.82%)に割り当てることができます。それぞれ10.23-24.28%、同じ分類器と領域があります)。 解釈と結論:我々の結果は、細菌混合物の分析のために、16S rRNAのV2-V3領域のシーケンスに続いて、Mothur-NBC分類器と16S-UDBデータベースを使用したデータの分析が優先されることを示しています。

BACKGROUND & OBJECTIVES: For bacterial community analysis, 16S rRNA sequences are subjected to taxonomic classification through comparison with one of the three commonly used databases [Greengenes, SILVA and Ribosomal Database Project (RDP)]. It was hypothesized that a unified database containing fully annotated, non-redundant sequences from all the three databases, might provide better taxonomic classification during analysis of 16S rRNA sequence data. Hence, a unified 16S rRNA database was constructed and its performance was assessed by using it with four different taxonomic assignment methods, and for data from various hypervariable regions (HVRs) of 16S rRNA gene. METHODS: We constructed a unified 16S rRNA database (16S-UDb) by merging non-ambiguous, fully annotated, full-length 16S rRNA sequences from the three databases and compared its performance in taxonomy assignment with that of three original databases. This was done using four different taxonomy assignment methods [mothur Naïve Bayesian Classifier (mothur-nbc), RDP Naïve Bayesian Classifier (rdp-nbc), UCLUST, SortMeRNA] and data from 13 regions of 16S rRNA [seven hypervariable regions (HVR) (V2-V8) and six pairs of adjacent HVRs]. RESULTS: Our unified 16S rRNA database contained 13,078 full-length, fully annotated 16S rRNA sequences. It could assign genus and species to larger proportions (90.05 and 46.82%, respectively, when used with mothur-nbc classifier and the V2+V3 region) of sequences in the test database than the three original 16S rRNA databases (70.88-87.20% and 10.23-24.28%, respectively, with the same classifier and region). INTERPRETATION & CONCLUSIONS: Our results indicate that for analysis of bacterial mixtures, sequencing of V2-V3 region of 16S rRNA followed by analysis of the data using the mothur-nbc classifier and our 16S-UDb database may be preferred.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google