Loading...
Nature2020May01Vol.581issue(7809)

141,456人の人間の変動から定量化された変異制約スペクトル

,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, N.I.H., Extramural
  • Research Support, Non-U.S. Gov't
概要
Abstract

タンパク質をコードする遺伝子を不活性化する遺伝的変異体は、遺伝子破壊の表現型の結果に関する強力な情報源です。生物の機能に重要な遺伝子は、自然集団のそのような変異体が枯渇しますが、非必須遺伝子はそれらを許容します。累積。ただし、予測される機能喪失バリアントは注釈エラーのために濃縮されており、非常に低い周波数で見つかる傾向があるため、分析には慎重なバリアント注釈と非常に大きなサンプルサイズ1が必要です。ここでは、ヒトシーケンス研究からの125,748個のexomesと15,708ゲノムの凝集について、ゲノム凝集データベース(GNOMAD)について説明します。シーケンスと注釈エラーによって引き起こされるアーティファクトをフィルタリングした後、このコホートで443,769の高度予測予測される機能喪失バリアントを特定します。ヒト突然変異率の改善されたモデルを使用して、不活性化に対する耐性を表すスペクトルに沿ってヒトタンパク質をコードする遺伝子を分類し、モデル生物と操作されたヒト細胞からのデータを使用してこの分類を検証し、それが使用されるために使用できることを示します。一般的な疾患と希少疾患の両方の遺伝子発見。

タンパク質をコードする遺伝子を不活性化する遺伝的変異体は、遺伝子破壊の表現型の結果に関する強力な情報源です。生物の機能に重要な遺伝子は、自然集団のそのような変異体が枯渇しますが、非必須遺伝子はそれらを許容します。累積。ただし、予測される機能喪失バリアントは注釈エラーのために濃縮されており、非常に低い周波数で見つかる傾向があるため、分析には慎重なバリアント注釈と非常に大きなサンプルサイズ1が必要です。ここでは、ヒトシーケンス研究からの125,748個のexomesと15,708ゲノムの凝集について、ゲノム凝集データベース(GNOMAD)について説明します。シーケンスと注釈エラーによって引き起こされるアーティファクトをフィルタリングした後、このコホートで443,769の高度予測予測される機能喪失バリアントを特定します。ヒト突然変異率の改善されたモデルを使用して、不活性化に対する耐性を表すスペクトルに沿ってヒトタンパク質をコードする遺伝子を分類し、モデル生物と操作されたヒト細胞からのデータを使用してこの分類を検証し、それが使用されるために使用できることを示します。一般的な疾患と希少疾患の両方の遺伝子発見。

Genetic variants that inactivate protein-coding genes are a powerful source of information about the phenotypic consequences of gene disruption: genes that are crucial for the function of an organism will be depleted of such variants in natural populations, whereas non-essential genes will tolerate their accumulation. However, predicted loss-of-function variants are enriched for annotation errors, and tend to be found at extremely low frequencies, so their analysis requires careful variant annotation and very large sample sizes1. Here we describe the aggregation of 125,748 exomes and 15,708 genomes from human sequencing studies into the Genome Aggregation Database (gnomAD). We identify 443,769 high-confidence predicted loss-of-function variants in this cohort after filtering for artefacts caused by sequencing and annotation errors. Using an improved model of human mutation rates, we classify human protein-coding genes along a spectrum that represents tolerance to inactivation, validate this classification using data from model organisms and engineered human cells, and show that it can be used to improve the power of gene discovery for both common and rare diseases.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google