Loading...
BMC bioinformatics2019Mar14Vol.20issue(Suppl 2)

ヒト参照ゲノムHG19またはHG38と呼ばれるバリアント間の類似性と相違点

,
,
,
,
,
,
,
,
,
,
,
,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

背景:参照ゲノム選択は、次世代シーケンス(NGS)データの分析を成功させるための前提条件です。現在の実践では、最新の2つの人間参照ゲノムバージョンの1つ、HG19またはHG38を採用しています。これまで、SNV識別に対するゲノムバージョンの影響は厳密に評価されていません。 方法:HG19対HG38に基づいて同定されたSNVを比較する分析を実施し、ゲノムインボトル(GIAB)プロジェクトから全ゲノムシーケンス(WGS)データを活用しました。まず、SNVは、HG19またはHG38のいずれかを備えた26の異なるバイオインフォマティクスパイプラインを使用して呼び出されました。次に、2つのツールを使用して、HG19とHG38の間に呼ばれるSNVを変換しました。最後に、変換率を計算し、HG19またはHG38で呼び出されるSNV間の不一致率を分析し、不一致SNVを特徴づけました。 結果:HG38からHG19への変換率(平均95%)は、HG19からHG38(平均99%)からHG38への変換率よりも低かった。変換率は、さまざまな呼び出しパイプライン間でわずかに異なりました。HG19またはHG38の間には、約1.5%のSNVが不一致に変換されました。HG38からHG19への変換には、より多くのSNVがあり、これにより、逆の変換よりも変換が失敗し、SNVが不快なSNV(HG19からHG38)がありました。不一致のSNVのほとんどは、読み取り深度が低く、GIABによって定義された信頼性SNVが低く、G/C対立遺伝子によって優勢でした(52%が予想される42%に対して52%が観察されました)。 結論:HG19とHG38の間でかなりの数のSNVを変換することはできませんでした。比較の慎重なレビューに基づいて、NGS SNV分析にはHG38(新しいバージョン)をお勧めします。要約すると、我々の発見は、人間の参照ゲノムの異なるバージョン間で特定されたSNVを翻訳する場合は注意を示唆しています。

背景:参照ゲノム選択は、次世代シーケンス(NGS)データの分析を成功させるための前提条件です。現在の実践では、最新の2つの人間参照ゲノムバージョンの1つ、HG19またはHG38を採用しています。これまで、SNV識別に対するゲノムバージョンの影響は厳密に評価されていません。 方法:HG19対HG38に基づいて同定されたSNVを比較する分析を実施し、ゲノムインボトル(GIAB)プロジェクトから全ゲノムシーケンス(WGS)データを活用しました。まず、SNVは、HG19またはHG38のいずれかを備えた26の異なるバイオインフォマティクスパイプラインを使用して呼び出されました。次に、2つのツールを使用して、HG19とHG38の間に呼ばれるSNVを変換しました。最後に、変換率を計算し、HG19またはHG38で呼び出されるSNV間の不一致率を分析し、不一致SNVを特徴づけました。 結果:HG38からHG19への変換率(平均95%)は、HG19からHG38(平均99%)からHG38への変換率よりも低かった。変換率は、さまざまな呼び出しパイプライン間でわずかに異なりました。HG19またはHG38の間には、約1.5%のSNVが不一致に変換されました。HG38からHG19への変換には、より多くのSNVがあり、これにより、逆の変換よりも変換が失敗し、SNVが不快なSNV(HG19からHG38)がありました。不一致のSNVのほとんどは、読み取り深度が低く、GIABによって定義された信頼性SNVが低く、G/C対立遺伝子によって優勢でした(52%が予想される42%に対して52%が観察されました)。 結論:HG19とHG38の間でかなりの数のSNVを変換することはできませんでした。比較の慎重なレビューに基づいて、NGS SNV分析にはHG38(新しいバージョン)をお勧めします。要約すると、我々の発見は、人間の参照ゲノムの異なるバージョン間で特定されたSNVを翻訳する場合は注意を示唆しています。

BACKGROUND: Reference genome selection is a prerequisite for successful analysis of next generation sequencing (NGS) data. Current practice employs one of the two most recent human reference genome versions: HG19 or HG38. To date, the impact of genome version on SNV identification has not been rigorously assessed. METHODS: We conducted analysis comparing the SNVs identified based on HG19 vs HG38, leveraging whole genome sequencing (WGS) data from the genome-in-a-bottle (GIAB) project. First, SNVs were called using 26 different bioinformatics pipelines with either HG19 or HG38. Next, two tools were used to convert the called SNVs between HG19 and HG38. Lastly we calculated conversion rates, analyzed discordant rates between SNVs called with HG19 or HG38, and characterized the discordant SNVs. RESULTS: The conversion rates from HG38 to HG19 (average 95%) were lower than the conversion rates from HG19 to HG38 (average 99%). The conversion rates varied slightly among the various calling pipelines. Around 1.5% SNVs were discordantly converted between HG19 or HG38. The conversions from HG38 to HG19 had more SNVs which failed conversion and more discordant SNVs than the opposite conversion (HG19 to HG38). Most of the discordant SNVs had low read depth, were low confidence SNVs as defined by GIAB, and/or were predominated by G/C alleles (52% observed versus 42% expected). CONCLUSION: A significant number of SNVs could not be converted between HG19 and HG38. Based on careful review of our comparisons, we recommend HG38 (the newer version) for NGS SNV analysis. To summarize, our findings suggest caution when translating identified SNVs between different versions of the human reference genome.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google