著名医師による解説が無料で読めます
すると翻訳の精度が向上します
Exomeシーケンスは、ヒト疾患および臨床遺伝診断の遺伝学的研究で広く使用されています。コピー数のバリエーション(CNV)の正確な検出は、Exomeシーケンスデータを完全に利用するために重要です。ただし、Exomeデータはうるさいです。既存の方法だけでは、高精度とリコール率の両方を達成することはできません。一般的な慣行は、ヒューリスティックなろ過を実行し、その後、推定CNVの読み取り深さを手動で検査することです。このアプローチは、大規模な研究では拡大しません。この問題に対処するために、ExomeシーケンスデータからまれなCNVを確認するために、インシコでのトランスファーラーニング方法CNV-Espressoを開発しました。CNV-Espressoは、Exome Dataの候補CNVを画像としてエンコードし、前処理された畳み込みニューラルネットワークモデルを使用してコピー数の状態を分類します。継承されたCNVをポジティブとして、メンデルエラーをネガとして伴うCNVを使用して、子孫の親友トリオエクソームシーケンスデータセットを使用してCNVとエスプレッソを訓練しました。Exomeおよび全ゲノムシーケンス(WGS)データの両方を持つ追加のサンプルを使用して、パフォーマンスを評価しました。WGSデータから検出されたCNVSがグラウンドトゥルースのプロキシとして検出されたと仮定すると、CNVとエスプレッソは、特に少数のエクソンに及ぶCNVの場合、リコールをほとんど無傷に保ちながら、精度を大幅に改善します。CNV-エスプレッソは、大規模なエクソームシーケンス研究におけるCNVの手動検査を効果的に置き換えることができます。
Exomeシーケンスは、ヒト疾患および臨床遺伝診断の遺伝学的研究で広く使用されています。コピー数のバリエーション(CNV)の正確な検出は、Exomeシーケンスデータを完全に利用するために重要です。ただし、Exomeデータはうるさいです。既存の方法だけでは、高精度とリコール率の両方を達成することはできません。一般的な慣行は、ヒューリスティックなろ過を実行し、その後、推定CNVの読み取り深さを手動で検査することです。このアプローチは、大規模な研究では拡大しません。この問題に対処するために、ExomeシーケンスデータからまれなCNVを確認するために、インシコでのトランスファーラーニング方法CNV-Espressoを開発しました。CNV-Espressoは、Exome Dataの候補CNVを画像としてエンコードし、前処理された畳み込みニューラルネットワークモデルを使用してコピー数の状態を分類します。継承されたCNVをポジティブとして、メンデルエラーをネガとして伴うCNVを使用して、子孫の親友トリオエクソームシーケンスデータセットを使用してCNVとエスプレッソを訓練しました。Exomeおよび全ゲノムシーケンス(WGS)データの両方を持つ追加のサンプルを使用して、パフォーマンスを評価しました。WGSデータから検出されたCNVSがグラウンドトゥルースのプロキシとして検出されたと仮定すると、CNVとエスプレッソは、特に少数のエクソンに及ぶCNVの場合、リコールをほとんど無傷に保ちながら、精度を大幅に改善します。CNV-エスプレッソは、大規模なエクソームシーケンス研究におけるCNVの手動検査を効果的に置き換えることができます。
Exome sequencing is widely used in genetic studies of human diseases and clinical genetic diagnosis. Accurate detection of copy number variants (CNVs) is important to fully utilize exome sequencing data. However, exome data are noisy. None of the existing methods alone can achieve both high precision and recall rate. A common practice is to perform heuristic filtration followed by manual inspection of read depth of putative CNVs. This approach does not scale in large studies. To address this issue, we developed a transfer learning method, CNV-espresso, for in silico confirming rare CNVs from exome sequencing data. CNV-espresso encodes candidate CNVs from exome data as images and uses pretrained convolutional neural network models to classify copy number states. We trained CNV-espresso using an offspring-parents trio exome sequencing dataset, with inherited CNVs as positives and CNVs with Mendelian errors as negatives. We evaluated the performance using additional samples that have both exome and whole-genome sequencing (WGS) data. Assuming the CNVs detected from WGS data as a proxy of ground truth, CNV-espresso significantly improves precision while keeping recall almost intact, especially for CNVs that span a small number of exons. CNV-espresso can effectively replace manual inspection of CNVs in large-scale exome sequencing studies.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。