著名医師による解説が無料で読めます
すると翻訳の精度が向上します
背景:メタゲノムシーケンスは、現代の生物科学の確立されたツールです。調査した生物学的サンプルの遺伝的含有量に関する比類のない洞察を約束しますが、描かれた結論は、ゲノムグアニンシトシン(GC)含有量の関数としての不正確な存在量推定を含むDNAシーケンス法に固有のバイアスから危険にさらされています。 結果:複数のゲノム(平均GC含有量が28.9%から62.4%の範囲)とメタゲノムを配列決定する実験で、一般的に使用される多くのプラットフォームでこのようなGCバイアスを調査しました。GCバイアスプロファイルは、ライブラリの準備プロトコルとシーケンスプラットフォームによって異なります。MiseqとNextSeqを使用したワークフローは、主要なGCバイアスによって妨げられており、45〜65%のGC範囲外でますます深刻になり、GCが豊富なGC貧しいシーケンスで誤って低いカバレッジをもたらすことがわかりました。30%のGCコンテンツでは、50%のGCコンテンツに近いWindowsよりも10倍以上のカバレッジが少なくなりました。また、GC含有量がカバレッジバイアスとしっかりと相関することも示しました。PacbioとHiseqのプラットフォームは、GCバイアスの同様のプロファイルも互いに証明しました。これは、MiseqやNextSeqワークフローとは異なるものとは異なりました。オックスフォードナノポアワークフローは、GCバイアスに苦しめられていませんでした。 結論:これらの発見は、GCバイアスから生じる潜在的な困難の原因を示しています。ゲノムシーケンスにおいて、関連するワークフローに固有のGCバイアスが理解されていれば、方法論的な最適化で先制的に対処できます。さらに、メタゲノム研究では、より重要なアプローチを定量的な豊富さの推定値で行うことをお勧めします。将来的には、メタゲノムの研究は、結論を引き出す前にGCバイアスの影響を考慮するための措置を講じるか、明らかに公平なワークフローを使用する必要があります。
背景:メタゲノムシーケンスは、現代の生物科学の確立されたツールです。調査した生物学的サンプルの遺伝的含有量に関する比類のない洞察を約束しますが、描かれた結論は、ゲノムグアニンシトシン(GC)含有量の関数としての不正確な存在量推定を含むDNAシーケンス法に固有のバイアスから危険にさらされています。 結果:複数のゲノム(平均GC含有量が28.9%から62.4%の範囲)とメタゲノムを配列決定する実験で、一般的に使用される多くのプラットフォームでこのようなGCバイアスを調査しました。GCバイアスプロファイルは、ライブラリの準備プロトコルとシーケンスプラットフォームによって異なります。MiseqとNextSeqを使用したワークフローは、主要なGCバイアスによって妨げられており、45〜65%のGC範囲外でますます深刻になり、GCが豊富なGC貧しいシーケンスで誤って低いカバレッジをもたらすことがわかりました。30%のGCコンテンツでは、50%のGCコンテンツに近いWindowsよりも10倍以上のカバレッジが少なくなりました。また、GC含有量がカバレッジバイアスとしっかりと相関することも示しました。PacbioとHiseqのプラットフォームは、GCバイアスの同様のプロファイルも互いに証明しました。これは、MiseqやNextSeqワークフローとは異なるものとは異なりました。オックスフォードナノポアワークフローは、GCバイアスに苦しめられていませんでした。 結論:これらの発見は、GCバイアスから生じる潜在的な困難の原因を示しています。ゲノムシーケンスにおいて、関連するワークフローに固有のGCバイアスが理解されていれば、方法論的な最適化で先制的に対処できます。さらに、メタゲノム研究では、より重要なアプローチを定量的な豊富さの推定値で行うことをお勧めします。将来的には、メタゲノムの研究は、結論を引き出す前にGCバイアスの影響を考慮するための措置を講じるか、明らかに公平なワークフローを使用する必要があります。
BACKGROUND: Metagenomic sequencing is a well-established tool in the modern biosciences. While it promises unparalleled insights into the genetic content of the biological samples studied, conclusions drawn are at risk from biases inherent to the DNA sequencing methods, including inaccurate abundance estimates as a function of genomic guanine-cytosine (GC) contents. RESULTS: We explored such GC biases across many commonly used platforms in experiments sequencing multiple genomes (with mean GC contents ranging from 28.9% to 62.4%) and metagenomes. GC bias profiles varied among different library preparation protocols and sequencing platforms. We found that our workflows using MiSeq and NextSeq were hindered by major GC biases, with problems becoming increasingly severe outside the 45-65% GC range, leading to a falsely low coverage in GC-rich and especially GC-poor sequences, where genomic windows with 30% GC content had >10-fold less coverage than windows close to 50% GC content. We also showed that GC content correlates tightly with coverage biases. The PacBio and HiSeq platforms also evidenced similar profiles of GC biases to each other, which were distinct from those seen in the MiSeq and NextSeq workflows. The Oxford Nanopore workflow was not afflicted by GC bias. CONCLUSIONS: These findings indicate potential sources of difficulty, arising from GC biases, in genome sequencing that could be pre-emptively addressed with methodological optimizations provided that the GC biases inherent to the relevant workflow are understood. Furthermore, it is recommended that a more critical approach be taken in quantitative abundance estimates in metagenomic studies. In the future, metagenomic studies should take steps to account for the effects of GC bias before drawing conclusions, or they should use a demonstrably unbiased workflow.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。