著名医師による解説が無料で読めます
すると翻訳の精度が向上します
背景:RNA-seqデータは、遺伝子発現の違いのため、異なる転写産物に対して本質的に不均一なものです。これにより、各サンプルから生成されるデータの量を決定することが困難になります。あまり表現されていない成績証明書を回復するためにいくら費やすべきですか?使用されるシーケンステクノロジーは、必然的に特定のシーケンスに対して常にバイアスがあるため、別の考慮事項です。これらの効果を調査するために、最初に、明確に注目された生物のセットからの高強度のライブラリを調べて、de novoアセンブリに対するシーケンスの深さの影響を確認しました。次に、Universal Human Reference RNA(UHRR)からシーケンスされたライブラリを調べて、Illumina HiseqとMGI DNBSEQ™テクノロジーの性能を比較しました。 結果:シーケンスの深さの問題については、約2〜8 Gbpのデータセットを使用してアセンブされたエクソミックシーケンスの量。ただし、組み立てられたゲノム配列の量は、分析された生物の多くについてプラトーではありませんでした。発表されていないゲノムシーケンスのほとんどは、一部のユーザーにとって生物学的意義が疑わしいシングルエキソン転写産物です。シーケンシングテクノロジーの問題については、分析されたプラットフォームの両方が同様の数のフルレングストランスクリプトを回復しました。HISEQアセンブリの欠落している「ギャップ」領域は、多くの場合、より高いGC含有量に起因していましたが、これはシーケンステクノロジーではなく、ライブラリの準備のアーティファクトである可能性があります。 結論:10 Gbp未満の控えめなデータセットを超えたシーケンス深度の増加により、ゲノム注釈で文書化されていないシングルエキソンの転写産物の多数が回復します。DNBSEQ™は、de novo RNA-seqアセンブリのhiseqの実行可能な代替手段です。
背景:RNA-seqデータは、遺伝子発現の違いのため、異なる転写産物に対して本質的に不均一なものです。これにより、各サンプルから生成されるデータの量を決定することが困難になります。あまり表現されていない成績証明書を回復するためにいくら費やすべきですか?使用されるシーケンステクノロジーは、必然的に特定のシーケンスに対して常にバイアスがあるため、別の考慮事項です。これらの効果を調査するために、最初に、明確に注目された生物のセットからの高強度のライブラリを調べて、de novoアセンブリに対するシーケンスの深さの影響を確認しました。次に、Universal Human Reference RNA(UHRR)からシーケンスされたライブラリを調べて、Illumina HiseqとMGI DNBSEQ™テクノロジーの性能を比較しました。 結果:シーケンスの深さの問題については、約2〜8 Gbpのデータセットを使用してアセンブされたエクソミックシーケンスの量。ただし、組み立てられたゲノム配列の量は、分析された生物の多くについてプラトーではありませんでした。発表されていないゲノムシーケンスのほとんどは、一部のユーザーにとって生物学的意義が疑わしいシングルエキソン転写産物です。シーケンシングテクノロジーの問題については、分析されたプラットフォームの両方が同様の数のフルレングストランスクリプトを回復しました。HISEQアセンブリの欠落している「ギャップ」領域は、多くの場合、より高いGC含有量に起因していましたが、これはシーケンステクノロジーではなく、ライブラリの準備のアーティファクトである可能性があります。 結論:10 Gbp未満の控えめなデータセットを超えたシーケンス深度の増加により、ゲノム注釈で文書化されていないシングルエキソンの転写産物の多数が回復します。DNBSEQ™は、de novo RNA-seqアセンブリのhiseqの実行可能な代替手段です。
BACKGROUND: RNA-Seq data is inherently nonuniform for different transcripts because of differences in gene expression. This makes it challenging to decide how much data should be generated from each sample. How much should one spend to recover the less expressed transcripts? The sequencing technology used is another consideration, as there are inevitably always biases against certain sequences. To investigate these effects, we first looked at high-depth libraries from a set of well-annotated organisms to ascertain the impact of sequencing depth on de novo assembly. We then looked at libraries sequenced from the Universal Human Reference RNA (UHRR) to compare the performance of Illumina HiSeq and MGI DNBseq™ technologies. RESULTS: On the issue of sequencing depth, the amount of exomic sequence assembled plateaued using data sets of approximately 2 to 8 Gbp. However, the amount of genomic sequence assembled did not plateau for many of the analyzed organisms. Most of the unannotated genomic sequences are single-exon transcripts whose biological significance will be questionable for some users. On the issue of sequencing technology, both of the analyzed platforms recovered a similar number of full-length transcripts. The missing "gap" regions in the HiSeq assemblies were often attributed to higher GC contents, but this may be an artefact of library preparation and not of sequencing technology. CONCLUSIONS: Increasing sequencing depth beyond modest data sets of less than 10 Gbp recovers a plethora of single-exon transcripts undocumented in genome annotations. DNBseq™ is a viable alternative to HiSeq for de novo RNA-Seq assembly.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。