Loading...
Nature communications2023Jun22Vol.14issue(1)

超高速で正確な電子イオン化質量スペクトルマッチングは、100万台のシリコライブラリとの複合同定のためのマッチング

,
,
,
,
,
,
,
,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

スペクトルマッチングは、質量分析(MS)における化合物識別の最も一般的な方法です。ただし、いくつかの課題は、スペクトルライブラリのカバレッジ、精度、マッチング速度など、その効率を制限しています。この研究では、100万台のシリコEI-MSライブラリが確立されています。さらに、Word2VECスペクトル埋め込みを使用して精度を大幅に改善し、階層航海型ナビゲーション型小世界グラフ(HNSW)を使用して速度を高めるために、超高速で正確なスペクトルマッチング(FASTEI)メソッドが提案されています。重み付きコサイン類似性法(WCS)と比較して、2桁のスピードアップで、10回のリコール@10精度(5 DA質量フィルターで88.3%)を達成します。fasteiが適用されてNIST 2017ライブラリを超えて分子を識別すると、50%のRecall@1の精度が達成されます。Fasteiは、計算背景が限られている一般ユーザー向けのスタンドアロンでユーザーフレンドリーなソフトウェアとしてパッケージ化されています。全体として、FASTEIと100万個のシリコのライブラリと組み合わされて、複合識別は正確で超高速なツールとして促進されます。

スペクトルマッチングは、質量分析(MS)における化合物識別の最も一般的な方法です。ただし、いくつかの課題は、スペクトルライブラリのカバレッジ、精度、マッチング速度など、その効率を制限しています。この研究では、100万台のシリコEI-MSライブラリが確立されています。さらに、Word2VECスペクトル埋め込みを使用して精度を大幅に改善し、階層航海型ナビゲーション型小世界グラフ(HNSW)を使用して速度を高めるために、超高速で正確なスペクトルマッチング(FASTEI)メソッドが提案されています。重み付きコサイン類似性法(WCS)と比較して、2桁のスピードアップで、10回のリコール@10精度(5 DA質量フィルターで88.3%)を達成します。fasteiが適用されてNIST 2017ライブラリを超えて分子を識別すると、50%のRecall@1の精度が達成されます。Fasteiは、計算背景が限られている一般ユーザー向けのスタンドアロンでユーザーフレンドリーなソフトウェアとしてパッケージ化されています。全体として、FASTEIと100万個のシリコのライブラリと組み合わされて、複合識別は正確で超高速なツールとして促進されます。

Spectrum matching is the most common method for compound identification in mass spectrometry (MS). However, some challenges limit its efficiency, including the coverage of spectral libraries, the accuracy, and the speed of matching. In this study, a million-scale in-silico EI-MS library is established. Furthermore, an ultra-fast and accurate spectrum matching (FastEI) method is proposed to substantially improve accuracy using Word2vec spectral embedding and boost the speed using the hierarchical navigable small-world graph (HNSW). It achieves 80.4% recall@10 accuracy (88.3% with 5 Da mass filter) with a speedup of two orders of magnitude compared with the weighted cosine similarity method (WCS). When FastEI is applied to identify the molecules beyond NIST 2017 library, it achieves 50% recall@1 accuracy. FastEI is packaged as a standalone and user-friendly software for common users with limited computational backgrounds. Overall, FastEI combined with a million-scale in-silico library facilitates compound identification as an accurate and ultra-fast tool.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google