Loading...
Genome research2017Oct01Vol.27issue(10)

Sasquatch:細胞および組織特異的DNaseフットプリントからの転写因子結合に対する調節SNPの影響を予測する

,
,
,
,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

ゲノムワイド関連研究(GWAS)と個別化医療の時代において、調節要素における単一ヌクレオチド多型(SNP)の影響を予測することが重要な目標です。調節SNPの可能性を判断するための現在のアプローチは、細胞特異的DNA結合モチーフの不十分な知識に依存します。ここでは、DNaseフットプリントデータを使用して転写因子の結合に対する非コードバリアントの効果を推定および視覚化する新しい計算アプローチであるSasquatchを提示します。Sasquatchは、DNaseフットプリントの包括的なK-MERベースの分析を実行して、特定の細胞型におけるタンパク質結合のK-MERの可能性と、これがシーケンスバリアントによってどのように変更されるかを決定します。したがって、Sasquatchは、既知の転写因子結合部位とモチーフとは無関係に、公平なアプローチを使用します。Sasquatchは、任意の遺伝子型から、セルタイプごとに単一のDNase-Seqデータセットを必要とし、異なる実験手順によって生成されたデータから一貫した予測を生成し、異なるシーケンス深度で生成します。ここでは、以前に検証された機能SNPを使用してSasquatchの有効性を示し、既存のアプローチに対するパフォーマンスをベンチマークします。Sasquatchは、Human Encode Collectionを含む公的に利用可能なデータを組み込んだ多用途のWebtoolとして利用できます。したがって、Sasquatchは、非コードゲノムの可能性のある調節SNPに優先順位を付けるための強力なツールとリポジトリを提供します。

ゲノムワイド関連研究(GWAS)と個別化医療の時代において、調節要素における単一ヌクレオチド多型(SNP)の影響を予測することが重要な目標です。調節SNPの可能性を判断するための現在のアプローチは、細胞特異的DNA結合モチーフの不十分な知識に依存します。ここでは、DNaseフットプリントデータを使用して転写因子の結合に対する非コードバリアントの効果を推定および視覚化する新しい計算アプローチであるSasquatchを提示します。Sasquatchは、DNaseフットプリントの包括的なK-MERベースの分析を実行して、特定の細胞型におけるタンパク質結合のK-MERの可能性と、これがシーケンスバリアントによってどのように変更されるかを決定します。したがって、Sasquatchは、既知の転写因子結合部位とモチーフとは無関係に、公平なアプローチを使用します。Sasquatchは、任意の遺伝子型から、セルタイプごとに単一のDNase-Seqデータセットを必要とし、異なる実験手順によって生成されたデータから一貫した予測を生成し、異なるシーケンス深度で生成します。ここでは、以前に検証された機能SNPを使用してSasquatchの有効性を示し、既存のアプローチに対するパフォーマンスをベンチマークします。Sasquatchは、Human Encode Collectionを含む公的に利用可能なデータを組み込んだ多用途のWebtoolとして利用できます。したがって、Sasquatchは、非コードゲノムの可能性のある調節SNPに優先順位を付けるための強力なツールとリポジトリを提供します。

In the era of genome-wide association studies (GWAS) and personalized medicine, predicting the impact of single nucleotide polymorphisms (SNPs) in regulatory elements is an important goal. Current approaches to determine the potential of regulatory SNPs depend on inadequate knowledge of cell-specific DNA binding motifs. Here, we present Sasquatch, a new computational approach that uses DNase footprint data to estimate and visualize the effects of noncoding variants on transcription factor binding. Sasquatch performs a comprehensive k-mer-based analysis of DNase footprints to determine any k-mer's potential for protein binding in a specific cell type and how this may be changed by sequence variants. Therefore, Sasquatch uses an unbiased approach, independent of known transcription factor binding sites and motifs. Sasquatch only requires a single DNase-seq data set per cell type, from any genotype, and produces consistent predictions from data generated by different experimental procedures and at different sequence depths. Here we demonstrate the effectiveness of Sasquatch using previously validated functional SNPs and benchmark its performance against existing approaches. Sasquatch is available as a versatile webtool incorporating publicly available data, including the human ENCODE collection. Thus, Sasquatch provides a powerful tool and repository for prioritizing likely regulatory SNPs in the noncoding genome.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google