Loading...
Genome biology2015Feb12Vol.16issue(1)

スペクタクル:スペクトル学習を使用した高速クロマチン状態注釈

,
,
文献タイプ:
  • Journal Article
概要
Abstract

エンコードからのエピゲノムデータを使用して、クロマチンマークの特定の組み合わせをヒトゲノムの調節要素と関連付けることができます。隠されたマルコフモデルと期待最大化(EM)アルゴリズムは、エピゲノムデータを分析するためによく使用されます。ただし、EMアルゴリズムは、クロマチン状態が高いクラスの不均衡を示し、収束が遅くなることが多いデータセットに過剰適合の問題を抱える可能性があります。ここでは、EMの代わりにスペクトル学習を使用し、ソフトウェアのスペクタクルがこれらの問題を克服していることがわかります。さらに、スペクタクルは、Chromhmmによって見つからないが、GWAS SNPで強く濃縮されているエンハンサーサブタイプを見つけることができます。スペクタクルはhttps://github.com/jiminsong/spectacleで入手できます。

エンコードからのエピゲノムデータを使用して、クロマチンマークの特定の組み合わせをヒトゲノムの調節要素と関連付けることができます。隠されたマルコフモデルと期待最大化(EM)アルゴリズムは、エピゲノムデータを分析するためによく使用されます。ただし、EMアルゴリズムは、クロマチン状態が高いクラスの不均衡を示し、収束が遅くなることが多いデータセットに過剰適合の問題を抱える可能性があります。ここでは、EMの代わりにスペクトル学習を使用し、ソフトウェアのスペクタクルがこれらの問題を克服していることがわかります。さらに、スペクタクルは、Chromhmmによって見つからないが、GWAS SNPで強く濃縮されているエンハンサーサブタイプを見つけることができます。スペクタクルはhttps://github.com/jiminsong/spectacleで入手できます。

Epigenomic data from ENCODE can be used to associate specific combinations of chromatin marks with regulatory elements in the human genome. Hidden Markov models and the expectation-maximization (EM) algorithm are often used to analyze epigenomic data. However, the EM algorithm can have overfitting problems in data sets where the chromatin states show high class-imbalance and it is often slow to converge. Here we use spectral learning instead of EM and find that our software Spectacle overcame these problems. Furthermore, Spectacle is able to find enhancer subtypes not found by ChromHMM but strongly enriched in GWAS SNPs. Spectacle is available at https://github.com/jiminsong/Spectacle.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google