Loading...
Bioinformatics (Oxford, England)2017Jul15Vol.33issue(14)

参照コホートバリエーショングラフに関するハプロタイプのモデリング

,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

動機:ハプロタイプの現在の統計モデルは、遺伝的変異が直線的に秩序化された二相またはマルチアレン遺伝子座の値の配列によって表されることができるハプロタイプのパネルに限定されています。これらの方法は、ネストまたはオーバーラップの構造バリアントやバリアントをモデル化することはできません。 結果:バリエーショングラフは、任意に複雑な遺伝的変異をエンコードできる数学構造です。バリエーショングラフ埋め込まれた母集団リファレンスコホートで動作する最初のハプロタイプモデルを提示します。アルゴリズムについて説明して、ハプロタイプがこのコホートから再結合を通じて生じた可能性を計算し、ハプロタイプの長さが時間の直線的で人口サイズのサブリニアルを実証します。さらに、関連するハプロタイプの尤度を迅速に計算する方法を示します。変異のモデリングを可能にするために、数学的拡張を説明します。この研究は、集団のあらゆる種類の変動を表すことができる最初のハプロタイプモデルであるため、臨床ゲノミクスと遺伝的疫学の重要な増分ステップです。 可用性と実装:githubでhttps://github.com/yoheirosen/vgで入手できます。 連絡先:benedict@soe.ucsc.edu。 補足情報:補足データは、バイオインフォマティクスオンラインで入手できます。

動機:ハプロタイプの現在の統計モデルは、遺伝的変異が直線的に秩序化された二相またはマルチアレン遺伝子座の値の配列によって表されることができるハプロタイプのパネルに限定されています。これらの方法は、ネストまたはオーバーラップの構造バリアントやバリアントをモデル化することはできません。 結果:バリエーショングラフは、任意に複雑な遺伝的変異をエンコードできる数学構造です。バリエーショングラフ埋め込まれた母集団リファレンスコホートで動作する最初のハプロタイプモデルを提示します。アルゴリズムについて説明して、ハプロタイプがこのコホートから再結合を通じて生じた可能性を計算し、ハプロタイプの長さが時間の直線的で人口サイズのサブリニアルを実証します。さらに、関連するハプロタイプの尤度を迅速に計算する方法を示します。変異のモデリングを可能にするために、数学的拡張を説明します。この研究は、集団のあらゆる種類の変動を表すことができる最初のハプロタイプモデルであるため、臨床ゲノミクスと遺伝的疫学の重要な増分ステップです。 可用性と実装:githubでhttps://github.com/yoheirosen/vgで入手できます。 連絡先:benedict@soe.ucsc.edu。 補足情報:補足データは、バイオインフォマティクスオンラインで入手できます。

MOTIVATION: Current statistical models of haplotypes are limited to panels of haplotypes whose genetic variation can be represented by arrays of values at linearly ordered bi- or multiallelic loci. These methods cannot model structural variants or variants that nest or overlap. RESULTS: A variation graph is a mathematical structure that can encode arbitrarily complex genetic variation. We present the first haplotype model that operates on a variation graph-embedded population reference cohort. We describe an algorithm to calculate the likelihood that a haplotype arose from this cohort through recombinations and demonstrate time complexity linear in haplotype length and sublinear in population size. We furthermore demonstrate a method of rapidly calculating likelihoods for related haplotypes. We describe mathematical extensions to allow modelling of mutations. This work is an important incremental step for clinical genomics and genetic epidemiology since it is the first haplotype model which can represent all sorts of variation in the population. AVAILABILITY AND IMPLEMENTATION: Available on GitHub at https://github.com/yoheirosen/vg . CONTACT: benedict@soe.ucsc.edu. SUPPLEMENTARY INFORMATION: Supplementary data are available at Bioinformatics online.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google