Loading...
PLoS genetics2013Mar01Vol.9issue(3)

多遺伝子リスクスコアのパワーと予測精度

,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

最近、大規模な関連研究で個別に重要性を達成しないマーカーのアンサンブル間の遺伝的効果を要約するために、ポリジェニックスコアが使用されています。マーカーは、初期トレーニングサンプルを使用して選択され、各被験者内の関連する対立遺伝子の加重合計を形成することにより、独立した複製サンプルでスコアを作成するために使用されます。特性とこの複合スコアとの関連は、選択されたマーカーに遺伝的信号が存在することを意味し、スコアは個々の特性値の予測に使用できることを意味します。このアプローチは、単一のマーカーが有意でない場合に遺伝的効果の証拠を得るために使用され、関連する障害の共通の遺伝的基礎を確立し、リスク予測モデルを構築します。ただし、場合によっては、望ましい関連または予測が達成されていません。ここでは、ポリジェニックスコアのパワーと予測精度は、2つのサンプルのサイズの関数としての定量的遺伝学モデルから導き出され、遺伝的分散、スコアにマーカーを含めるための選択しきい値、および重み付けの効果のサイズを重み付けする方法を説明しました。スコア。式は定量的および離散的な特性に対して導出され、後者はケース/コントロールサンプリングを可能にします。マーカーパネルによって説明された分散を推定するための新しいアプローチも提案されています。ポリジェニックスコアの有意な関連性を伴う公開された研究は十分に駆動されているのに対し、マイナスの結果を持つ研究はサンプルサイズが低いことで説明できることが示されています。また、予測因子が非常に大きなサンプルから推定され、現在利用可能なものよりも1桁大きい場合にのみ、有用なレベルの予測に近づくことができることも示されています。したがって、多遺伝子スコアは現在、複雑な特性を予測するよりも関連性テストの有用性が高くなっていますが、サンプルサイズが増え続けるにつれて予測はより実現可能になります。

最近、大規模な関連研究で個別に重要性を達成しないマーカーのアンサンブル間の遺伝的効果を要約するために、ポリジェニックスコアが使用されています。マーカーは、初期トレーニングサンプルを使用して選択され、各被験者内の関連する対立遺伝子の加重合計を形成することにより、独立した複製サンプルでスコアを作成するために使用されます。特性とこの複合スコアとの関連は、選択されたマーカーに遺伝的信号が存在することを意味し、スコアは個々の特性値の予測に使用できることを意味します。このアプローチは、単一のマーカーが有意でない場合に遺伝的効果の証拠を得るために使用され、関連する障害の共通の遺伝的基礎を確立し、リスク予測モデルを構築します。ただし、場合によっては、望ましい関連または予測が達成されていません。ここでは、ポリジェニックスコアのパワーと予測精度は、2つのサンプルのサイズの関数としての定量的遺伝学モデルから導き出され、遺伝的分散、スコアにマーカーを含めるための選択しきい値、および重み付けの効果のサイズを重み付けする方法を説明しました。スコア。式は定量的および離散的な特性に対して導出され、後者はケース/コントロールサンプリングを可能にします。マーカーパネルによって説明された分散を推定するための新しいアプローチも提案されています。ポリジェニックスコアの有意な関連性を伴う公開された研究は十分に駆動されているのに対し、マイナスの結果を持つ研究はサンプルサイズが低いことで説明できることが示されています。また、予測因子が非常に大きなサンプルから推定され、現在利用可能なものよりも1桁大きい場合にのみ、有用なレベルの予測に近づくことができることも示されています。したがって、多遺伝子スコアは現在、複雑な特性を予測するよりも関連性テストの有用性が高くなっていますが、サンプルサイズが増え続けるにつれて予測はより実現可能になります。

Polygenic scores have recently been used to summarise genetic effects among an ensemble of markers that do not individually achieve significance in a large-scale association study. Markers are selected using an initial training sample and used to construct a score in an independent replication sample by forming the weighted sum of associated alleles within each subject. Association between a trait and this composite score implies that a genetic signal is present among the selected markers, and the score can then be used for prediction of individual trait values. This approach has been used to obtain evidence of a genetic effect when no single markers are significant, to establish a common genetic basis for related disorders, and to construct risk prediction models. In some cases, however, the desired association or prediction has not been achieved. Here, the power and predictive accuracy of a polygenic score are derived from a quantitative genetics model as a function of the sizes of the two samples, explained genetic variance, selection thresholds for including a marker in the score, and methods for weighting effect sizes in the score. Expressions are derived for quantitative and discrete traits, the latter allowing for case/control sampling. A novel approach to estimating the variance explained by a marker panel is also proposed. It is shown that published studies with significant association of polygenic scores have been well powered, whereas those with negative results can be explained by low sample size. It is also shown that useful levels of prediction may only be approached when predictors are estimated from very large samples, up to an order of magnitude greater than currently available. Therefore, polygenic scores currently have more utility for association testing than predicting complex traits, but prediction will become more feasible as sample sizes continue to grow.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google