Loading...
Nature2023Jun14Vol.issue()

36の中国集団のパンゲノーム参照

,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

人間のゲノミクスは、単一の参照シーケンスからパンゲノム形式への進行中のパラダイムシフトを目撃していますが、アジアの祖先の個体群は過小評価されています。ここでは、中国のパンゲノムコンソーシアムの第1フェーズからのデータを提示します。これには、36の少数派の中国民族グループを表す58のコアサンプルに基づいた116の高品質およびハプロタイプが段階的なDE NOVOアセンブリのコレクションが含まれます。平均30.65倍の高忠実度の長い読み取りシーケンスカバレッジ、35.63メガベースを超える平均連続N50、3.01ギガベースの平均合計サイズで、CPCコアアセンブリは、ユークロマティック多型シーケンスと1,367777777777777777777777777のコードアセンブリを追加します。GRCH38への遺伝子複製。1590万の小さなバリアントと78,072の構造バリアントを特定しました。中国のパンゲノムコンソーシアムデータは、個人が過小評価されている少数民族グループから含まれている場合、斬新で欠落しているシーケンスの発見の著しい増加を示しています。欠落している参照配列は、ケラチン化、紫外線放射、DNA修復、免疫学的反応、寿命への反応に関連する重要な機能を付与する古風な対立遺伝子と遺伝子で濃縮され、人間の進化に新たな光を削除し、複雑な遺伝性を回復するための大きな可能性を暗示しています。病気のマッピング。

人間のゲノミクスは、単一の参照シーケンスからパンゲノム形式への進行中のパラダイムシフトを目撃していますが、アジアの祖先の個体群は過小評価されています。ここでは、中国のパンゲノムコンソーシアムの第1フェーズからのデータを提示します。これには、36の少数派の中国民族グループを表す58のコアサンプルに基づいた116の高品質およびハプロタイプが段階的なDE NOVOアセンブリのコレクションが含まれます。平均30.65倍の高忠実度の長い読み取りシーケンスカバレッジ、35.63メガベースを超える平均連続N50、3.01ギガベースの平均合計サイズで、CPCコアアセンブリは、ユークロマティック多型シーケンスと1,367777777777777777777777777のコードアセンブリを追加します。GRCH38への遺伝子複製。1590万の小さなバリアントと78,072の構造バリアントを特定しました。中国のパンゲノムコンソーシアムデータは、個人が過小評価されている少数民族グループから含まれている場合、斬新で欠落しているシーケンスの発見の著しい増加を示しています。欠落している参照配列は、ケラチン化、紫外線放射、DNA修復、免疫学的反応、寿命への反応に関連する重要な機能を付与する古風な対立遺伝子と遺伝子で濃縮され、人間の進化に新たな光を削除し、複雑な遺伝性を回復するための大きな可能性を暗示しています。病気のマッピング。

Human genomics is witnessing an ongoing paradigm shift from a single reference sequence to a pangenome form, but populations of Asian ancestry are underrepresented. Here we present data from the first phase of the Chinese Pangenome Consortium, including a collection of 116 high-quality and haplotype-phased de novo assemblies based on 58 core samples representing 36 minority Chinese ethnic groups. With an average 30.65× high-fidelity long-read sequence coverage, an average contiguity N50 of more than 35.63 megabases and an average total size of 3.01 gigabases, the CPC core assemblies add 189 million base pairs of euchromatic polymorphic sequences and 1,367 protein-coding gene duplications to GRCh38. We identified 15.9 million small variants and 78,072 structural variants, of which 5.9 million small variants and 34,223 structural variants were not reported in a recently released pangenome reference1. The Chinese Pangenome Consortium data demonstrate a remarkable increase in the discovery of novel and missing sequences when individuals are included from underrepresented minority ethnic groups. The missing reference sequences were enriched with archaic-derived alleles and genes that confer essential functions related to keratinization, response to ultraviolet radiation, DNA repair, immunological responses and lifespan, implying great potential for shedding new light on human evolution and recovering missing heritability in complex disease mapping.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google