著名医師による解説が無料で読めます
すると翻訳の精度が向上します
背景:ゲノムデータは、癌などのヒト疾患を含む機能的および進化的遺伝的研究における細かいスケールの時間的および空間的解像度で複雑なメカニズムを理解するための主要なリソースになっています。最近、酵母の進化する集団の多数のゲノム(Saccharomyces cerevisiae W303株)を時間依存的に配列決定して、時間的進化パターンを特定しました。このタイプの研究では、後で導出されたゲノムと比較するには、時間ゼロのひずみまたは集団の染色体レベルの配列アセンブリが必要です。ただし、シーケンスデータのユニークな特徴を使用して染色体レベルのゲノムアセンブリを確立するための実験進化研究では、完全に自動化された計算アプローチはありません。 方法と結果:この研究では、短縮シーケンスから3つのDE NOVOアセンブラーを使用して複数の初期アセンブリを生成および組み合わせて生成および組み合わせて染色体レベルのゲノムシーケンスアセンブリを構築するために、新しいソフトウェアパイプラインである統合メタアセンブリパイプライン(IMAP)を開発しました。データ。シーケンスデータとハイブリッドアセンブリアプローチの大規模なコレクションを使用して、ゲノムアセンブリの連続性と精度を大幅に改善しました。酵母株W303およびSK1の染色体レベルのアセンブリを生成することにより、パイプラインを検証し、結果を長い読みのシーケンスとさまざまなアセンブリ評価メトリックを使用して構築したアセンブリと結果を比較しました。また、S。cerevisiae株Sigma1278bの染色体レベルの配列アセンブリと、一般的に使用される3つの真菌株を構築しました。最後に、酵母株W303およびSK1の最終アセンブリの品質に対する参照や解像度などのIMAPパラメーターの効果を調べました。 結論:ショートリードシーケンスデータのみを使用して染色体レベルのシーケンスアセンブリを生成するための費用対効果の高いパイプラインを開発しました。パイプラインは、参照ガイド付きおよびメタアセンブリアプローチの強度を組み合わせています。当社のパイプラインは、http://github.com/jkimlab/imapでオンラインで入手でき、Docker画像やPerlスクリプトを含むPerlスクリプトを含む、ユーザーがいくつかの前提条件プログラムを含むIMAPパッケージをインストールできるようにします。ユーザーはIMAPを使用して、興味のあるゲノムのために染色体レベルのアセンブリを簡単に構築できます。
背景:ゲノムデータは、癌などのヒト疾患を含む機能的および進化的遺伝的研究における細かいスケールの時間的および空間的解像度で複雑なメカニズムを理解するための主要なリソースになっています。最近、酵母の進化する集団の多数のゲノム(Saccharomyces cerevisiae W303株)を時間依存的に配列決定して、時間的進化パターンを特定しました。このタイプの研究では、後で導出されたゲノムと比較するには、時間ゼロのひずみまたは集団の染色体レベルの配列アセンブリが必要です。ただし、シーケンスデータのユニークな特徴を使用して染色体レベルのゲノムアセンブリを確立するための実験進化研究では、完全に自動化された計算アプローチはありません。 方法と結果:この研究では、短縮シーケンスから3つのDE NOVOアセンブラーを使用して複数の初期アセンブリを生成および組み合わせて生成および組み合わせて染色体レベルのゲノムシーケンスアセンブリを構築するために、新しいソフトウェアパイプラインである統合メタアセンブリパイプライン(IMAP)を開発しました。データ。シーケンスデータとハイブリッドアセンブリアプローチの大規模なコレクションを使用して、ゲノムアセンブリの連続性と精度を大幅に改善しました。酵母株W303およびSK1の染色体レベルのアセンブリを生成することにより、パイプラインを検証し、結果を長い読みのシーケンスとさまざまなアセンブリ評価メトリックを使用して構築したアセンブリと結果を比較しました。また、S。cerevisiae株Sigma1278bの染色体レベルの配列アセンブリと、一般的に使用される3つの真菌株を構築しました。最後に、酵母株W303およびSK1の最終アセンブリの品質に対する参照や解像度などのIMAPパラメーターの効果を調べました。 結論:ショートリードシーケンスデータのみを使用して染色体レベルのシーケンスアセンブリを生成するための費用対効果の高いパイプラインを開発しました。パイプラインは、参照ガイド付きおよびメタアセンブリアプローチの強度を組み合わせています。当社のパイプラインは、http://github.com/jkimlab/imapでオンラインで入手でき、Docker画像やPerlスクリプトを含むPerlスクリプトを含む、ユーザーがいくつかの前提条件プログラムを含むIMAPパッケージをインストールできるようにします。ユーザーはIMAPを使用して、興味のあるゲノムのために染色体レベルのアセンブリを簡単に構築できます。
BACKGROUND: Genomic data have become major resources to understand complex mechanisms at fine-scale temporal and spatial resolution in functional and evolutionary genetic studies, including human diseases, such as cancers. Recently, a large number of whole genomes of evolving populations of yeast (Saccharomyces cerevisiae W303 strain) were sequenced in a time-dependent manner to identify temporal evolutionary patterns. For this type of study, a chromosome-level sequence assembly of the strain or population at time zero is required to compare with the genomes derived later. However, there is no fully automated computational approach in experimental evolution studies to establish the chromosome-level genome assembly using unique features of sequencing data. METHODS AND RESULTS: In this study, we developed a new software pipeline, the integrative meta-assembly pipeline (IMAP), to build chromosome-level genome sequence assemblies by generating and combining multiple initial assemblies using three de novo assemblers from short-read sequencing data. We significantly improved the continuity and accuracy of the genome assembly using a large collection of sequencing data and hybrid assembly approaches. We validated our pipeline by generating chromosome-level assemblies of yeast strains W303 and SK1, and compared our results with assemblies built using long-read sequencing and various assembly evaluation metrics. We also constructed chromosome-level sequence assemblies of S. cerevisiae strain Sigma1278b, and three commonly used fungal strains: Aspergillus nidulans A713, Neurospora crassa 73, and Thielavia terrestris CBS 492.74, for which long-read sequencing data are not yet available. Finally, we examined the effect of IMAP parameters, such as reference and resolution, on the quality of the final assembly of the yeast strains W303 and SK1. CONCLUSIONS: We developed a cost-effective pipeline to generate chromosome-level sequence assemblies using only short-read sequencing data. Our pipeline combines the strengths of reference-guided and meta-assembly approaches. Our pipeline is available online at http://github.com/jkimlab/IMAP including a Docker image, as well as a Perl script, to help users install the IMAP package, including several prerequisite programs. Users can use IMAP to easily build the chromosome-level assembly for the genome of their interest.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。