著名医師による解説が無料で読めます
すると翻訳の精度が向上します
動機:コーディングシーケンスの詳細な知識は、病原性バリアントの優先順位付けのさまざまな候補モデルにつながりました。ゲノムの非コーディング部分に対していくつかの激しい激しいスコアが提案されていますが、そのパフォーマンスを評価するためにこれまでに大規模な比較は実現されていません。 結果:主要なスコアリングツール(CADD、FATHMM-MKL、FUNSEQ2、GWAVA)と、想定された良性バリアントから想定される病原性バリアントを区別する能力と(Clinvar、Cosmic、およびCosmicを使用して、想定される病原性バリアントを識別する能力と比較しました。1000ゲノムプロジェクトデータベース)。Clinvarベンチマークを使用して、CADDは、主にタンパク質コーディング遺伝子領域に位置する病原性バリアントを検出するための最良のツールでした。宇宙ベンチマークを使用して、Fathmm-MKL、Gwava、およびSomliverは、通常、Lincrnas、Pseudogenes、および非コーディングゲノムの他の部分に位置する病原性バリアントの他のツールよりも優れていました。ただし、すべてのツールは精度が低かったため、将来の非コーディングゲノム機能の発見により改善される可能性があります。これらの結果は、宇宙データベースに潜在的な良性バリアントの存在に影響された可能性があります。これらの地域のClinvarと同じように一貫性のあるゴールドスタンダードの開発は、ツールのランキングを確認するために必要です。 可用性と実装:Snakemake、C ++、およびRコードは、https://github.com/oncostat/benchmarkncvtoolsから無料で入手でき、Linuxでサポートされています。 連絡先:damien.drubay@gustaveroussy.frまたはstefan.michiels@gustaveroussy.fr。 補足情報:補足データは、バイオインフォマティクスオンラインで入手できます。
動機:コーディングシーケンスの詳細な知識は、病原性バリアントの優先順位付けのさまざまな候補モデルにつながりました。ゲノムの非コーディング部分に対していくつかの激しい激しいスコアが提案されていますが、そのパフォーマンスを評価するためにこれまでに大規模な比較は実現されていません。 結果:主要なスコアリングツール(CADD、FATHMM-MKL、FUNSEQ2、GWAVA)と、想定された良性バリアントから想定される病原性バリアントを区別する能力と(Clinvar、Cosmic、およびCosmicを使用して、想定される病原性バリアントを識別する能力と比較しました。1000ゲノムプロジェクトデータベース)。Clinvarベンチマークを使用して、CADDは、主にタンパク質コーディング遺伝子領域に位置する病原性バリアントを検出するための最良のツールでした。宇宙ベンチマークを使用して、Fathmm-MKL、Gwava、およびSomliverは、通常、Lincrnas、Pseudogenes、および非コーディングゲノムの他の部分に位置する病原性バリアントの他のツールよりも優れていました。ただし、すべてのツールは精度が低かったため、将来の非コーディングゲノム機能の発見により改善される可能性があります。これらの結果は、宇宙データベースに潜在的な良性バリアントの存在に影響された可能性があります。これらの地域のClinvarと同じように一貫性のあるゴールドスタンダードの開発は、ツールのランキングを確認するために必要です。 可用性と実装:Snakemake、C ++、およびRコードは、https://github.com/oncostat/benchmarkncvtoolsから無料で入手でき、Linuxでサポートされています。 連絡先:damien.drubay@gustaveroussy.frまたはstefan.michiels@gustaveroussy.fr。 補足情報:補足データは、バイオインフォマティクスオンラインで入手できます。
MOTIVATION: Detailed knowledge of coding sequences has led to different candidate models for pathogenic variant prioritization. Several deleteriousness scores have been proposed for the non-coding part of the genome, but no large-scale comparison has been realized to date to assess their performance. RESULTS: We compared the leading scoring tools (CADD, FATHMM-MKL, Funseq2 and GWAVA) and some recent competitors (DANN, SNP and SOM scores) for their ability to discriminate assumed pathogenic variants from assumed benign variants (using the ClinVar, COSMIC and 1000 genomes project databases). Using the ClinVar benchmark, CADD was the best tool for detecting the pathogenic variants that are mainly located in protein coding gene regions. Using the COSMIC benchmark, FATHMM-MKL, GWAVA and SOMliver outperformed the other tools for pathogenic variants that are typically located in lincRNAs, pseudogenes and other parts of the non-coding genome. However, all tools had low precision, which could potentially be improved by future non-coding genome feature discoveries. These results may have been influenced by the presence of potential benign variants in the COSMIC database. The development of a gold standard as consistent as ClinVar for these regions will be necessary to confirm our tool ranking. AVAILABILITY AND IMPLEMENTATION: The Snakemake, C++ and R codes are freely available from https://github.com/Oncostat/BenchmarkNCVTools and supported on Linux. CONTACT: damien.drubay@gustaveroussy.fr or stefan.michiels@gustaveroussy.fr. SUPPLEMENTARY INFORMATION: Supplementary data are available at Bioinformatics online.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。