Loading...
Molecular biology and evolution2012Nov01Vol.29issue(11)

無限に多くの遺伝子をテストする細菌コアゲノムとパンゲノムの進化のためのモデル

,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

関連する細菌ゲノムのグループを比較すると、すべてのゲノムで見つかったコア遺伝子の数は通常、平均ゲノムサイズよりもはるかに少ないのに対し、パンゲノームのサイズ(少なくとも1つのゲノムで見つかった遺伝子のセット)は非常に大きいです1つのゲノムの平均サイズよりも大きい。172の菌の完全なゲノムを分析し、このグループから取った単系統サブセットのパンゲノムとコアゲノムの特性を比較します。次に、これらの特性を予測するために、いくつかの進化モデルの機能を評価します。無限に多くの遺伝子(IMG)モデルは、それぞれの新しい遺伝子が一度だけ発生する可能性があるという仮定に基づいています。モデルの予測は、ゲノムの発散の根底にある進化ツリーの形状に依存します。coalsed coalscentの木、星の木、および定義された固定枝の長さの任意の系統樹の結果を計算します。星の木では、いくつかの以前の研究で示唆されているように、パンゲノームのサイズはゲノムの数と直線的に増加しますが、合体の木では対数的に増加します。合体の木は、私たちが考慮するすべての例に対して、データにより適しています。場合によっては、固定系統樹は、遺伝子周波数スペクトルの繁殖構造で合体ツリーよりも優れていましたが、コアサイズとパンゲノムサイズの予測にはほとんど改善されませんでした。データのほとんどは、3つのクラスの遺伝子を持つモデルでよく説明されています。すべてのゲノムに見られる重要なクラス、オリジネーションと削除の速度がゲノムの発散の時期と比較して遅いクラス、高速急速な起源と削除を示すクラス。ゲノムに由来する遺伝子の大部分は高速クラスにありますが、これらの遺伝子は長期間保持されておらず、ゲノムに存在する遺伝子の大部分はゆっくりまたは必須のクラスにあります。一般に、IMGモデルは、種レベルと広く発散する分類群の両方について、実験的なゲノムデータとの比較に役立つことを示しています。説明されている式を実装するソフトウェアは、http://github.com/rec3141/pangenomeで提供されます。

関連する細菌ゲノムのグループを比較すると、すべてのゲノムで見つかったコア遺伝子の数は通常、平均ゲノムサイズよりもはるかに少ないのに対し、パンゲノームのサイズ(少なくとも1つのゲノムで見つかった遺伝子のセット)は非常に大きいです1つのゲノムの平均サイズよりも大きい。172の菌の完全なゲノムを分析し、このグループから取った単系統サブセットのパンゲノムとコアゲノムの特性を比較します。次に、これらの特性を予測するために、いくつかの進化モデルの機能を評価します。無限に多くの遺伝子(IMG)モデルは、それぞれの新しい遺伝子が一度だけ発生する可能性があるという仮定に基づいています。モデルの予測は、ゲノムの発散の根底にある進化ツリーの形状に依存します。coalsed coalscentの木、星の木、および定義された固定枝の長さの任意の系統樹の結果を計算します。星の木では、いくつかの以前の研究で示唆されているように、パンゲノームのサイズはゲノムの数と直線的に増加しますが、合体の木では対数的に増加します。合体の木は、私たちが考慮するすべての例に対して、データにより適しています。場合によっては、固定系統樹は、遺伝子周波数スペクトルの繁殖構造で合体ツリーよりも優れていましたが、コアサイズとパンゲノムサイズの予測にはほとんど改善されませんでした。データのほとんどは、3つのクラスの遺伝子を持つモデルでよく説明されています。すべてのゲノムに見られる重要なクラス、オリジネーションと削除の速度がゲノムの発散の時期と比較して遅いクラス、高速急速な起源と削除を示すクラス。ゲノムに由来する遺伝子の大部分は高速クラスにありますが、これらの遺伝子は長期間保持されておらず、ゲノムに存在する遺伝子の大部分はゆっくりまたは必須のクラスにあります。一般に、IMGモデルは、種レベルと広く発散する分類群の両方について、実験的なゲノムデータとの比較に役立つことを示しています。説明されている式を実装するソフトウェアは、http://github.com/rec3141/pangenomeで提供されます。

When groups of related bacterial genomes are compared, the number of core genes found in all genomes is usually much less than the mean genome size, whereas the size of the pangenome (the set of genes found on at least one of the genomes) is much larger than the mean size of one genome. We analyze 172 complete genomes of Bacilli and compare the properties of the pangenomes and core genomes of monophyletic subsets taken from this group. We then assess the capabilities of several evolutionary models to predict these properties. The infinitely many genes (IMG) model is based on the assumption that each new gene can arise only once. The predictions of the model depend on the shape of the evolutionary tree that underlies the divergence of the genomes. We calculate results for coalescent trees, star trees, and arbitrary phylogenetic trees of predefined fixed branch length. On a star tree, the pangenome size increases linearly with the number of genomes, as has been suggested in some previous studies, whereas on a coalescent tree, it increases logarithmically. The coalescent tree gives a better fit to the data, for all the examples we consider. In some cases, a fixed phylogenetic tree proved better than the coalescent tree at reproducing structure in the gene frequency spectrum, but little improvement was gained in predictions of the core and pangenome sizes. Most of the data are well explained by a model with three classes of gene: an essential class that is found in all genomes, a slow class whose rate of origination and deletion is slow compared with the time of divergence of the genomes, and a fast class showing rapid origination and deletion. Although the majority of genes originating in a genome are in the fast class, these genes are not retained for long periods, and the majority of genes present in a genome are in the slow or essential classes. In general, we show that the IMG model is useful for comparison with experimental genome data both for species level and widely divergent taxonomic groups. Software implementing the described formulae is provided at http://github.com/rec3141/pangenome.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google