Loading...
Ecology and evolution2019Feb01Vol.9issue(3)

種レベルの分類学的割り当てのために、キュレーションされた18SおよびCO1参照シーケンスデータベースを使用した自由生活の海洋線虫のメタバーコード

,
,
,
,
,
,
,
,
,
,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

ハイスループットシーケンスは、種レベルの解像度を伴う多様性の高効率でありながら包括的な評価を伴う生物学的コミュニティを記述する可能性があります。キュレーションされたリボソームおよびミトコンドリア線虫の参照シーケンスデータベースの有用性を調査して、門岩固有の種レベルのクラスタリングしきい値を決定しました。それぞれ438のリボソームと290のミトコンドリア配列を編集しました。これらのシーケンスは、それぞれ99%と94%を識別クラスタリングのしきい値として識別しました。これらのしきい値は、39の線虫種とベトナムの環境サンプルを含む模擬コミュニティのHTSデータで評価されました。2つの読み取りマースと2つのクラスタリングアルゴリズムとクラスターフリーのDADA2パイプラインによって生成されたモックの分類学的説明を比較しました。RDP分類器との分類上の割り当ては、さまざまなトレーニングセットで評価されました。我々の結果は、それぞれのクラスタリングしきい値でUCLUST_REF OTUSの分子マーカー(18S:32、JB2:19、JB3:21)で36/39の模擬線虫種が同定され、UPARSE_DENOVOと一般的に使用される97%の類似性を上回ることを示しました。DADA2は、最も現実的な数のASV(18S:83、JB2:75、JB3:82)を生成し、30/39の模擬種を集合的に識別しました。リボソームマーカーは、OTUとASVの両方の種と属レベルの検出の観点からミトコンドリアマーカーを上回りました。OTU/ASVの分類学的割り当ての数は、線虫シーケンスのみを含む最小の参照データベースが使用され、シーケンスがそれぞれのアンプリコン長に切り捨てられた場合に最も高かった。全体として、OTUはより多くの種レベルの検出を生成しましたが、これはASVと比較してより高いエラー率に関連していました。ASVを使用した属レベルの割り当ては、種レベルの割り当てと比較してより高い精度と低いエラー率を示し、これが環境サンプルからのアルファ多様性の迅速な評価のための最も信頼できるパイプラインであることを示唆しています。

ハイスループットシーケンスは、種レベルの解像度を伴う多様性の高効率でありながら包括的な評価を伴う生物学的コミュニティを記述する可能性があります。キュレーションされたリボソームおよびミトコンドリア線虫の参照シーケンスデータベースの有用性を調査して、門岩固有の種レベルのクラスタリングしきい値を決定しました。それぞれ438のリボソームと290のミトコンドリア配列を編集しました。これらのシーケンスは、それぞれ99%と94%を識別クラスタリングのしきい値として識別しました。これらのしきい値は、39の線虫種とベトナムの環境サンプルを含む模擬コミュニティのHTSデータで評価されました。2つの読み取りマースと2つのクラスタリングアルゴリズムとクラスターフリーのDADA2パイプラインによって生成されたモックの分類学的説明を比較しました。RDP分類器との分類上の割り当ては、さまざまなトレーニングセットで評価されました。我々の結果は、それぞれのクラスタリングしきい値でUCLUST_REF OTUSの分子マーカー(18S:32、JB2:19、JB3:21)で36/39の模擬線虫種が同定され、UPARSE_DENOVOと一般的に使用される97%の類似性を上回ることを示しました。DADA2は、最も現実的な数のASV(18S:83、JB2:75、JB3:82)を生成し、30/39の模擬種を集合的に識別しました。リボソームマーカーは、OTUとASVの両方の種と属レベルの検出の観点からミトコンドリアマーカーを上回りました。OTU/ASVの分類学的割り当ての数は、線虫シーケンスのみを含む最小の参照データベースが使用され、シーケンスがそれぞれのアンプリコン長に切り捨てられた場合に最も高かった。全体として、OTUはより多くの種レベルの検出を生成しましたが、これはASVと比較してより高いエラー率に関連していました。ASVを使用した属レベルの割り当ては、種レベルの割り当てと比較してより高い精度と低いエラー率を示し、これが環境サンプルからのアルファ多様性の迅速な評価のための最も信頼できるパイプラインであることを示唆しています。

High-throughput sequencing has the potential to describe biological communities with high efficiency yet comprehensive assessment of diversity with species-level resolution remains one of the most challenging aspects of metabarcoding studies. We investigated the utility of curated ribosomal and mitochondrial nematode reference sequence databases for determining phylum-specific species-level clustering thresholds. We compiled 438 ribosomal and 290 mitochondrial sequences which identified 99% and 94% as the species delineation clustering threshold, respectively. These thresholds were evaluated in HTS data from mock communities containing 39 nematode species as well as environmental samples from Vietnam. We compared the taxonomic description of the mocks generated by two read-merging and two clustering algorithms and the cluster-free Dada2 pipeline. Taxonomic assignment with the RDP classifier was assessed under different training sets. Our results showed that 36/39 mock nematode species were identified across the molecular markers (18S: 32, JB2: 19, JB3: 21) in UClust_ref OTUs at their respective clustering thresholds, outperforming UParse_denovo and the commonly used 97% similarity. Dada2 generated the most realistic number of ASVs (18S: 83, JB2: 75, JB3: 82), collectively identifying 30/39 mock species. The ribosomal marker outperformed the mitochondrial markers in terms of species and genus-level detections for both OTUs and ASVs. The number of taxonomic assignments of OTUs/ASVs was highest when the smallest reference database containing only nematode sequences was used and when sequences were truncated to the respective amplicon length. Overall, OTUs generated more species-level detections, which were, however, associated with higher error rates compared to ASVs. Genus-level assignments using ASVs exhibited higher accuracy and lower error rates compared to species-level assignments, suggesting that this is the most reliable pipeline for rapid assessment of alpha diversity from environmental samples.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google