Loading...
Plant physiology2018Feb01Vol.176issue(2)

LTR_RETRIEVER:長期ターミナルリピートレトロトランスポゾンを識別するための非常に正確で敏感なプログラム

,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
  • Research Support, U.S. Gov't, Non-P.H.S.
概要
Abstract

植物ゲノムでは、長期末端リピートレトロトランスポゾン(LTR-RTS)が一般的です。LTR-RTSの同定は、高品質の遺伝子注釈を達成するために重要です。よく保存されている構造に基づいて、LTR-RTSのde novo識別のために複数のプログラムが開発されました。ただし、これらのプログラムは、特異性が低く、誤発見率が高いことに関連しています。ここでは、LTR_RETRIEVERを報告します。LTR_RETRIEVERは、LTR-RTSを識別し、ゲノムシーケンスから高品質のLTRライブラリを生成するマルチスレッドエンパワーPERLプログラムです。LTR_RETRIEVERは、イネ(Oryza sativa)で高レベルの感度(91%)、特異性(97%)、精度(96%)、および精度(90%)を達成することにより、大幅な改善を実証しました。LTR_RETRIEVERは、長いシーケンス読み取りと互換性があります。40kの自己修正されたPacbioは、シロイヌナズナ(シロイヌナズナ(シロイヌナズナ)の4.5×ゲノムカバーに相当する読み取りで、構築されたLTRライブラリは優れた感度と特異性を示しました。5'-TG…CA-3 'ティルニを備えた標準的なLTR-RTSに加えて、LTR_RETRIEVERは、ゲノム全体の研究ではほとんど無視されている非標準LTR-RTS(非TGCA)も識別します。50個の植物ゲノムのうち42個から7種類の非標準LTRを特定しました。非標準LTRの大部分はコピア要素であり、LTRは他のコピア要素のそれよりも4倍短く、これはターゲットの特異性の結果である可能性があります。驚くべきことに、非TGCAコピア要素はしばしば遺伝子領域に配置され、近くまたは遺伝子内に優先的に挿入されており、遺伝子の進化への影響と変異誘発ツールとしての可能性を示しています。

植物ゲノムでは、長期末端リピートレトロトランスポゾン(LTR-RTS)が一般的です。LTR-RTSの同定は、高品質の遺伝子注釈を達成するために重要です。よく保存されている構造に基づいて、LTR-RTSのde novo識別のために複数のプログラムが開発されました。ただし、これらのプログラムは、特異性が低く、誤発見率が高いことに関連しています。ここでは、LTR_RETRIEVERを報告します。LTR_RETRIEVERは、LTR-RTSを識別し、ゲノムシーケンスから高品質のLTRライブラリを生成するマルチスレッドエンパワーPERLプログラムです。LTR_RETRIEVERは、イネ(Oryza sativa)で高レベルの感度(91%)、特異性(97%)、精度(96%)、および精度(90%)を達成することにより、大幅な改善を実証しました。LTR_RETRIEVERは、長いシーケンス読み取りと互換性があります。40kの自己修正されたPacbioは、シロイヌナズナ(シロイヌナズナ(シロイヌナズナ)の4.5×ゲノムカバーに相当する読み取りで、構築されたLTRライブラリは優れた感度と特異性を示しました。5'-TG…CA-3 'ティルニを備えた標準的なLTR-RTSに加えて、LTR_RETRIEVERは、ゲノム全体の研究ではほとんど無視されている非標準LTR-RTS(非TGCA)も識別します。50個の植物ゲノムのうち42個から7種類の非標準LTRを特定しました。非標準LTRの大部分はコピア要素であり、LTRは他のコピア要素のそれよりも4倍短く、これはターゲットの特異性の結果である可能性があります。驚くべきことに、非TGCAコピア要素はしばしば遺伝子領域に配置され、近くまたは遺伝子内に優先的に挿入されており、遺伝子の進化への影響と変異誘発ツールとしての可能性を示しています。

Long terminal repeat retrotransposons (LTR-RTs) are prevalent in plant genomes. The identification of LTR-RTs is critical for achieving high-quality gene annotation. Based on the well-conserved structure, multiple programs were developed for the de novo identification of LTR-RTs; however, these programs are associated with low specificity and high false discovery rates. Here, we report LTR_retriever, a multithreading-empowered Perl program that identifies LTR-RTs and generates high-quality LTR libraries from genomic sequences. LTR_retriever demonstrated significant improvements by achieving high levels of sensitivity (91%), specificity (97%), accuracy (96%), and precision (90%) in rice (Oryza sativa). LTR_retriever is also compatible with long sequencing reads. With 40k self-corrected PacBio reads equivalent to 4.5× genome coverage in Arabidopsis (Arabidopsis thaliana), the constructed LTR library showed excellent sensitivity and specificity. In addition to canonical LTR-RTs with 5'-TG…CA-3' termini, LTR_retriever also identifies noncanonical LTR-RTs (non-TGCA), which have been largely ignored in genome-wide studies. We identified seven types of noncanonical LTRs from 42 out of 50 plant genomes. The majority of noncanonical LTRs are Copia elements, with which the LTR is four times shorter than that of other Copia elements, which may be a result of their target specificity. Strikingly, non-TGCA Copia elements are often located in genic regions and preferentially insert nearby or within genes, indicating their impact on the evolution of genes and their potential as mutagenesis tools.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google