Loading...
BMC bioinformatics2006Mar16Vol.7issue()

隠されたマルコフモデルを使用した原核生物のゲノムにおけるゲノム島のスコアベースの予測

,
,
,
,
,
,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

背景:水平遺伝子移動(HGT)は、微生物ゲノムの含有量を実質的に形作る強力な進化力と考えられています。これは、HGTを遺伝子ジェネシス、重複、または突然変異と区別する環境要求の変化に対する迅速な適応を可能にする速度の違いです。正確な特性評価には、信頼性が高い転送イベントを識別するアルゴリズムが必要です。多くの場合、転送されたDNAの断片はかなりの長さで、いくつかの遺伝子を含み、ゲノム島(GI)またはより具体的には病原性または共生島と呼ばれます。 結果:GISと各エイリアン遺伝子の推定ドナーを予測するプログラムSigi-HMMを実装しました。これは、研究中のゲノムの個々の遺伝子のコドン使用(CU)の分析に基づいています。各遺伝子のCuは、微生物ドナーまたは高度に発現した遺伝子を表すCUテーブルの慎重に選択されたセットと比較されます。複数のテストを使用して、推定上のエイリアン遺伝子を識別し、推定ドナーを予測し、推定上高度に発現した遺伝子をマスクします。したがって、遺伝子レベルで動作する不均一な隠されたマルコフモデルの状態と排出確率を決定します。遷移確率のために、感度コントローラーを一貫した方法で統合することを目的として、古典的なテスト理論を利用します。Sigi-HMMはJavaで書かれており、公開されています。embl-formatに従って作成されたファイルを入力として受け入れます。ゲノムブラウザーに読みやすい一般的なGFF形式で出力を生成します。ベンチマークテストでは、Sigi-HMMの出力が既知の発見と一致していることが示されました。その予測は、注釈付きGISと、異なる方法によって生成される予測との両方と一致していました。 結論:Sigi-HMMは、微生物ゲノムにおけるGISを同定するための敏感なツールです。ゲノムを詳細にインタラクティブに分析し、獲得した遺伝子の起源に関する仮説を生成またはテストすることができます。

背景:水平遺伝子移動(HGT)は、微生物ゲノムの含有量を実質的に形作る強力な進化力と考えられています。これは、HGTを遺伝子ジェネシス、重複、または突然変異と区別する環境要求の変化に対する迅速な適応を可能にする速度の違いです。正確な特性評価には、信頼性が高い転送イベントを識別するアルゴリズムが必要です。多くの場合、転送されたDNAの断片はかなりの長さで、いくつかの遺伝子を含み、ゲノム島(GI)またはより具体的には病原性または共生島と呼ばれます。 結果:GISと各エイリアン遺伝子の推定ドナーを予測するプログラムSigi-HMMを実装しました。これは、研究中のゲノムの個々の遺伝子のコドン使用(CU)の分析に基づいています。各遺伝子のCuは、微生物ドナーまたは高度に発現した遺伝子を表すCUテーブルの慎重に選択されたセットと比較されます。複数のテストを使用して、推定上のエイリアン遺伝子を識別し、推定ドナーを予測し、推定上高度に発現した遺伝子をマスクします。したがって、遺伝子レベルで動作する不均一な隠されたマルコフモデルの状態と排出確率を決定します。遷移確率のために、感度コントローラーを一貫した方法で統合することを目的として、古典的なテスト理論を利用します。Sigi-HMMはJavaで書かれており、公開されています。embl-formatに従って作成されたファイルを入力として受け入れます。ゲノムブラウザーに読みやすい一般的なGFF形式で出力を生成します。ベンチマークテストでは、Sigi-HMMの出力が既知の発見と一致していることが示されました。その予測は、注釈付きGISと、異なる方法によって生成される予測との両方と一致していました。 結論:Sigi-HMMは、微生物ゲノムにおけるGISを同定するための敏感なツールです。ゲノムを詳細にインタラクティブに分析し、獲得した遺伝子の起源に関する仮説を生成またはテストすることができます。

BACKGROUND: Horizontal gene transfer (HGT) is considered a strong evolutionary force shaping the content of microbial genomes in a substantial manner. It is the difference in speed enabling the rapid adaptation to changing environmental demands that distinguishes HGT from gene genesis, duplications or mutations. For a precise characterization, algorithms are needed that identify transfer events with high reliability. Frequently, the transferred pieces of DNA have a considerable length, comprise several genes and are called genomic islands (GIs) or more specifically pathogenicity or symbiotic islands. RESULTS: We have implemented the program SIGI-HMM that predicts GIs and the putative donor of each individual alien gene. It is based on the analysis of codon usage (CU) of each individual gene of a genome under study. CU of each gene is compared against a carefully selected set of CU tables representing microbial donors or highly expressed genes. Multiple tests are used to identify putatively alien genes, to predict putative donors and to mask putatively highly expressed genes. Thus, we determine the states and emission probabilities of an inhomogeneous hidden Markov model working on gene level. For the transition probabilities, we draw upon classical test theory with the intention of integrating a sensitivity controller in a consistent manner. SIGI-HMM was written in JAVA and is publicly available. It accepts as input any file created according to the EMBL-format.It generates output in the common GFF format readable for genome browsers. Benchmark tests showed that the output of SIGI-HMM is in agreement with known findings. Its predictions were both consistent with annotated GIs and with predictions generated by different methods. CONCLUSION: SIGI-HMM is a sensitive tool for the identification of GIs in microbial genomes. It allows to interactively analyze genomes in detail and to generate or to test hypotheses about the origin of acquired genes.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google