Loading...
PloS one20140101Vol.9issue(11)

期待最尤法テストを使用して、帰属変異体との関連研究

,
,
,
,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, N.I.H., Extramural
概要
Abstract

遺伝子型の代入は、現代の遺伝的研究における標準的な慣行となっています。シーケンスベースの参照パネルが成長し続けるにつれて、ますます多くのマーカーが順調またはより良く帰属していますが、同時に、より低いマイナーな対立遺伝子頻度を持つさらに多くのマーカーが低い不足品質で帰属しています。ここでは、パワーおよび/または計算効率が改善された、下流の関連分析のために不可解な不確実性を組み込んだ新しい方法を提案します。次の2つのシナリオを検討します。i)すべての潜在的な遺伝子型の事後確率が推定される場合。ii)1次元の要約統計のみが入力された投与量のみが利用可能な場合。シナリオIのために、事後確率に基づいた関連性の期待最大化尤度比率テストを開発しました。帰属用量のみが利用可能である場合(シナリオII)、最初に投与量を与えられた後部分布から遺伝子型確率をサンプリングし、次にサンプリングされた確率にEM-LRTを適用します。私たちのシミュレーションは、両方のシナリオで提案されているEM-LRTメソッドのタイプIエラーが保護されていることを示しています。既存の方法と比較して、EM-LRT-ProB(シナリオIの場合)は、MAFの幅広いスペクトルと代入品質にわたって最適な統計力を提供します。EM-LRT-Dose(シナリオIIの場合)は、EM-LRT-ProBと同様のレベルの統計力を達成し、特に比較的低いMAFまたは代入品質を持つマーカーの場合、標準の投与方法を上回ります。2つの実際のデータセットへのアプリケーション、Cebu縦断的健康と栄養調査の研究と女性の健康イニシアチブ研究は、提案された方法の妥当性と効率性をさらにサポートします。

遺伝子型の代入は、現代の遺伝的研究における標準的な慣行となっています。シーケンスベースの参照パネルが成長し続けるにつれて、ますます多くのマーカーが順調またはより良く帰属していますが、同時に、より低いマイナーな対立遺伝子頻度を持つさらに多くのマーカーが低い不足品質で帰属しています。ここでは、パワーおよび/または計算効率が改善された、下流の関連分析のために不可解な不確実性を組み込んだ新しい方法を提案します。次の2つのシナリオを検討します。i)すべての潜在的な遺伝子型の事後確率が推定される場合。ii)1次元の要約統計のみが入力された投与量のみが利用可能な場合。シナリオIのために、事後確率に基づいた関連性の期待最大化尤度比率テストを開発しました。帰属用量のみが利用可能である場合(シナリオII)、最初に投与量を与えられた後部分布から遺伝子型確率をサンプリングし、次にサンプリングされた確率にEM-LRTを適用します。私たちのシミュレーションは、両方のシナリオで提案されているEM-LRTメソッドのタイプIエラーが保護されていることを示しています。既存の方法と比較して、EM-LRT-ProB(シナリオIの場合)は、MAFの幅広いスペクトルと代入品質にわたって最適な統計力を提供します。EM-LRT-Dose(シナリオIIの場合)は、EM-LRT-ProBと同様のレベルの統計力を達成し、特に比較的低いMAFまたは代入品質を持つマーカーの場合、標準の投与方法を上回ります。2つの実際のデータセットへのアプリケーション、Cebu縦断的健康と栄養調査の研究と女性の健康イニシアチブ研究は、提案された方法の妥当性と効率性をさらにサポートします。

Genotype imputation has become standard practice in modern genetic studies. As sequencing-based reference panels continue to grow, increasingly more markers are being well or better imputed but at the same time, even more markers with relatively low minor allele frequency are being imputed with low imputation quality. Here, we propose new methods that incorporate imputation uncertainty for downstream association analysis, with improved power and/or computational efficiency. We consider two scenarios: I) when posterior probabilities of all potential genotypes are estimated; and II) when only the one-dimensional summary statistic, imputed dosage, is available. For scenario I, we have developed an expectation-maximization likelihood-ratio test for association based on posterior probabilities. When only imputed dosages are available (scenario II), we first sample the genotype probabilities from its posterior distribution given the dosages, and then apply the EM-LRT on the sampled probabilities. Our simulations show that type I error of the proposed EM-LRT methods under both scenarios are protected. Compared with existing methods, EM-LRT-Prob (for scenario I) offers optimal statistical power across a wide spectrum of MAF and imputation quality. EM-LRT-Dose (for scenario II) achieves a similar level of statistical power as EM-LRT-Prob and, outperforms the standard Dosage method, especially for markers with relatively low MAF or imputation quality. Applications to two real data sets, the Cebu Longitudinal Health and Nutrition Survey study and the Women's Health Initiative Study, provide further support to the validity and efficiency of our proposed methods.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google