著名医師による解説が無料で読めます
すると翻訳の精度が向上します
非標識:主成分分析(PCA)は、ゲノム全体の関連研究(GWAS)の集団構造を制御するために広く使用されています。通常、主要なコンポーネント(PC)は人口構造を反映していますが、必要なPCの数を決定し、PCが非定型リンケージ不平衡(LD)を持つ領域などの他のアーティファクトをキャプチャしないようにすることで課題が生じます。後者に応じて、多くのグループがLD剪定を実行するか、PCAの前に既知の高LD領域を除外することを提案します。ただし、これらの提案は普遍的に実装されておらず、特に混合された集団のコンテキストでは、GWASへの影響は完全には理解されていません。この論文では、前処理の影響と、女性の健康イニシアチブSNP健康協会のリソースからアフリカ系アメリカ人サンプルのGWASモデルに含まれるPCの数と、精密医療用の全ゲノムシーケンスプロジェクトの貢献研究のための2つのトランスオミクスを調査します(ジャクソン心臓研究と慢性閉塞性肺疾患研究の遺伝的疫学)。3つのサンプルすべてで、最初のPCはゲノム全体の祖先と非常に相関しているのに対し、後のPCはしばしば局所的なゲノム機能をキャプチャします。そのパターン、およびいくつの遺伝的変異体が個々のPCと非常に相関していることは、ヨーロッパの集団に焦点を当てた以前の研究で観察されたものとは異なり、異なる下流の結果につながります。コライダーバイアスの現象による偽の関連。以前の研究で特定された高LD領域を除外しても、これらの問題は解決しません。LDプルーニングはより効果的であることが証明されていますが、しきい値の最適な選択はデータセットによって異なります。全体として、私たちの研究は、PCAを使用して混合された集団の祖先の不均一性を制御するときに発生するユニークな問題を強調し、複数のローカルゲノム機能をキャプチャするPCがGWASモデルに含まれないように、慎重な前処理と診断の重要性を実証します。 著者の概要:主成分分析(PCA)は、人間の遺伝学研究で広く使用されている技術です。最も頻繁なアプリケーションの1つは、遺伝的関連研究の文脈であり、研究者はPCAを使用して、研究参加者の遺伝的祖先を推測し、調整します。強力なアプローチですが、以前の研究では、PCAが他の機能やデータの品質の問題をキャプチャすることがあり、これらの懸念に対処するために前処理の手順が提案されていることが示されています。ただし、この推奨される前処理のユーティリティとダウンストリームの意味は完全には理解されておらず、これらのステップは普遍的に実装されていません。さらに、この分野での以前の研究の大部分は、ヨーロッパの祖先の個人のみを含む研究で実施されました。ここでは、これまでの遺伝学研究で大部分が過小評価されてきた多様で混合した祖先との混合された集団人口の文脈でこの作業を再訪します。この文脈で発生する可能性のあるユニークな懸念を示し、遺伝関連研究モデルの主成分を含む有害な影響を慎重に実装しない場合に有効な効果を示します。全体として、私たちの仕事が、混合された集団およびそれ以降にPCAを実装する場合の慎重な前処理、診断、およびモデリングの選択を含むケアを思い出させるものとして役立つことを願っています。
非標識:主成分分析(PCA)は、ゲノム全体の関連研究(GWAS)の集団構造を制御するために広く使用されています。通常、主要なコンポーネント(PC)は人口構造を反映していますが、必要なPCの数を決定し、PCが非定型リンケージ不平衡(LD)を持つ領域などの他のアーティファクトをキャプチャしないようにすることで課題が生じます。後者に応じて、多くのグループがLD剪定を実行するか、PCAの前に既知の高LD領域を除外することを提案します。ただし、これらの提案は普遍的に実装されておらず、特に混合された集団のコンテキストでは、GWASへの影響は完全には理解されていません。この論文では、前処理の影響と、女性の健康イニシアチブSNP健康協会のリソースからアフリカ系アメリカ人サンプルのGWASモデルに含まれるPCの数と、精密医療用の全ゲノムシーケンスプロジェクトの貢献研究のための2つのトランスオミクスを調査します(ジャクソン心臓研究と慢性閉塞性肺疾患研究の遺伝的疫学)。3つのサンプルすべてで、最初のPCはゲノム全体の祖先と非常に相関しているのに対し、後のPCはしばしば局所的なゲノム機能をキャプチャします。そのパターン、およびいくつの遺伝的変異体が個々のPCと非常に相関していることは、ヨーロッパの集団に焦点を当てた以前の研究で観察されたものとは異なり、異なる下流の結果につながります。コライダーバイアスの現象による偽の関連。以前の研究で特定された高LD領域を除外しても、これらの問題は解決しません。LDプルーニングはより効果的であることが証明されていますが、しきい値の最適な選択はデータセットによって異なります。全体として、私たちの研究は、PCAを使用して混合された集団の祖先の不均一性を制御するときに発生するユニークな問題を強調し、複数のローカルゲノム機能をキャプチャするPCがGWASモデルに含まれないように、慎重な前処理と診断の重要性を実証します。 著者の概要:主成分分析(PCA)は、人間の遺伝学研究で広く使用されている技術です。最も頻繁なアプリケーションの1つは、遺伝的関連研究の文脈であり、研究者はPCAを使用して、研究参加者の遺伝的祖先を推測し、調整します。強力なアプローチですが、以前の研究では、PCAが他の機能やデータの品質の問題をキャプチャすることがあり、これらの懸念に対処するために前処理の手順が提案されていることが示されています。ただし、この推奨される前処理のユーティリティとダウンストリームの意味は完全には理解されておらず、これらのステップは普遍的に実装されていません。さらに、この分野での以前の研究の大部分は、ヨーロッパの祖先の個人のみを含む研究で実施されました。ここでは、これまでの遺伝学研究で大部分が過小評価されてきた多様で混合した祖先との混合された集団人口の文脈でこの作業を再訪します。この文脈で発生する可能性のあるユニークな懸念を示し、遺伝関連研究モデルの主成分を含む有害な影響を慎重に実装しない場合に有効な効果を示します。全体として、私たちの仕事が、混合された集団およびそれ以降にPCAを実装する場合の慎重な前処理、診断、およびモデリングの選択を含むケアを思い出させるものとして役立つことを願っています。
UNLABELLED: Principal component analysis (PCA) is widely used to control for population structure in genome-wide association studies (GWAS). Top principal components (PCs) typically reflect population structure, but challenges arise in deciding how many PCs are needed and ensuring that PCs do not capture other artifacts such as regions with atypical linkage disequilibrium (LD). In response to the latter, many groups suggest performing LD pruning or excluding known high LD regions prior to PCA. However, these suggestions are not universally implemented and the implications for GWAS are not fully understood, especially in the context of admixed populations. In this paper, we investigate the impact of pre-processing and the number of PCs included in GWAS models in African American samples from the Women's Women's Health Initiative SNP Health Association Resource and two Trans-Omics for Precision Medicine Whole Genome Sequencing Project contributing studies (Jackson Heart Study and Genetic Epidemiology of Chronic Obstructive Pulmonary Disease Study). In all three samples, we find the first PC is highly correlated with genome-wide ancestry whereas later PCs often capture local genomic features. The pattern of which, and how many, genetic variants are highly correlated with individual PCs differs from what has been observed in prior studies focused on European populations and leads to distinct downstream consequences: adjusting for such PCs yields biased effect size estimates and elevated rates of spurious associations due to the phenomenon of collider bias. Excluding high LD regions identified in previous studies does not resolve these issues. LD pruning proves more effective, but the optimal choice of thresholds varies across datasets. Altogether, our work highlights unique issues that arise when using PCA to control for ancestral heterogeneity in admixed populations and demonstrates the importance of careful pre-processing and diagnostics to ensure that PCs capturing multiple local genomic features are not included in GWAS models. AUTHOR SUMMARY: Principal component analysis (PCA) is a widely used technique in human genetics research. One of its most frequent applications is in the context of genetic association studies, wherein researchers use PCA to infer, and then adjust for, the genetic ancestry of study participants. Although a powerful approach, prior work has shown that PCA sometimes captures other features or data quality issues, and pre-processing steps have been suggested to address these concerns. However, the utility and downstream implications of this recommended preprocessing are not fully understood, nor are these steps universally implemented. Moreover, the vast majority of prior work in this area was conducted in studies that exclusively included individuals of European ancestry. Here, we revisit this work in the context of admixed populations-populations with diverse, mixed ancestry that have been largely underrepresented in genetics research to date. We demonstrate the unique concerns that can arise in this context and illustrate the detrimental effects that including principal components in genetic association study models can have when not implemented carefully. Altogether, we hope our work serves as a reminder of the care that must be taken-including careful pre-processing, diagnostics, and modeling choices-when implementing PCA in admixed populations and beyond.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。






