Loading...
PLoS computational biology20120101Vol.8issue(7)

シーケンスカバレッジ、SNPアレイ密度、および代入の関数としての効率とパワー

,
,
,
,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, N.I.H., Extramural
概要
Abstract

高いカバレッジ全ゲノムシーケンスは、遺伝的変異に関するほぼ完全な情報を提供します。ただし、他のテクノロジーは、(a)サンプル内の冗長なカバレッジを減らし、(b)サンプル全体の遺伝的変異のパターンを活用することにより、より効率的になる可能性があります。したがって、できるだけ多くのサンプルを特徴付けるために、多くの遺伝学的研究は、統計的代入と結合された低いカバレッジシーケンスまたはSNPアレイジェノタイピングを採用しています。これらのアプローチを個別にも連携して比較するために、シーケンスの読み取り、アレイの強度、および代入から共同で遺伝子型を推定する統計的フレームワークを開発しました。ヨーロッパのサンプルでは、1×シーケンスまたは1 M SNPアレイのいずれかを含む代入から、同様の感度(89%)と特異性(99.6%)が見つかります。感度は、特に低周波多型(MAF <5%)の場合、低いカバレッジシーケンスの読み取りが密度の高いゲノム全体のSNPアレイに追加されると、逆は真実ではありません。シーケンスが読み取られ、アレイ強度が異なるサンプル遺伝子型を生成するサイトでは、共同分析により遺伝子型エラーが減少し、新しいエラーモードが識別されます。私たちの共同フレームワークは、ゲノムワイド関連研究における次世代シーケンスの使用を通知し、遺伝子型呼び出しのための改善された方法の開発をサポートします。

高いカバレッジ全ゲノムシーケンスは、遺伝的変異に関するほぼ完全な情報を提供します。ただし、他のテクノロジーは、(a)サンプル内の冗長なカバレッジを減らし、(b)サンプル全体の遺伝的変異のパターンを活用することにより、より効率的になる可能性があります。したがって、できるだけ多くのサンプルを特徴付けるために、多くの遺伝学的研究は、統計的代入と結合された低いカバレッジシーケンスまたはSNPアレイジェノタイピングを採用しています。これらのアプローチを個別にも連携して比較するために、シーケンスの読み取り、アレイの強度、および代入から共同で遺伝子型を推定する統計的フレームワークを開発しました。ヨーロッパのサンプルでは、1×シーケンスまたは1 M SNPアレイのいずれかを含む代入から、同様の感度(89%)と特異性(99.6%)が見つかります。感度は、特に低周波多型(MAF <5%)の場合、低いカバレッジシーケンスの読み取りが密度の高いゲノム全体のSNPアレイに追加されると、逆は真実ではありません。シーケンスが読み取られ、アレイ強度が異なるサンプル遺伝子型を生成するサイトでは、共同分析により遺伝子型エラーが減少し、新しいエラーモードが識別されます。私たちの共同フレームワークは、ゲノムワイド関連研究における次世代シーケンスの使用を通知し、遺伝子型呼び出しのための改善された方法の開発をサポートします。

High coverage whole genome sequencing provides near complete information about genetic variation. However, other technologies can be more efficient in some settings by (a) reducing redundant coverage within samples and (b) exploiting patterns of genetic variation across samples. To characterize as many samples as possible, many genetic studies therefore employ lower coverage sequencing or SNP array genotyping coupled to statistical imputation. To compare these approaches individually and in conjunction, we developed a statistical framework to estimate genotypes jointly from sequence reads, array intensities, and imputation. In European samples, we find similar sensitivity (89%) and specificity (99.6%) from imputation with either 1× sequencing or 1 M SNP arrays. Sensitivity is increased, particularly for low-frequency polymorphisms (MAF < 5%), when low coverage sequence reads are added to dense genome-wide SNP arrays--the converse, however, is not true. At sites where sequence reads and array intensities produce different sample genotypes, joint analysis reduces genotype errors and identifies novel error modes. Our joint framework informs the use of next-generation sequencing in genome wide association studies and supports development of improved methods for genotype calling.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google