Loading...
BMC bioinformatics2012May30Vol.13issue()

PYMS:ガスクロマトグラフィーマス分光測定(GC-MS)データアプリケーションの処理と選択されたツールの比較研究のためのPythonツールキット

,
,
,
,
,
,
,
,
,
,
,
,
,
文献タイプ:
  • Comparative Study
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

背景:Gas Chromatography-Mass分光法(GC-MS)は、代謝物の標的および非標的測定で頻繁に使用される手法です。RAW機器GC-MSデータの処理のためのほとんどの既存のソフトウェアツールは、データ処理方法をグラフィカルなユーザーインターフェイスとインタラクティブデータ処理を促進することをしっかりと統合します。GC-MSアプリケーションではインタラクティブ処理が非常に重要なままですが、ハイスループットの研究により、ハイスループットのカスタマイズされた処理パイプラインのスクリプティングに適したコマンドラインツールの必要性がますます指示されています。 結果:PYMSは、Pythonで開発された機器GC-MSデータを処理するための機能ライブラリで構成されています。PYMSは現在、標準データ形式(Andi-MS/NetCDFおよびJCAMP-DX)の読み取り、ノイズスムージング、ベースライン補正、ピーク検出、ピークデコンボリューション、ピーク積分、およびピークアライメントを含むGC-MS処理機能の完全なセットを提供しています。動的プログラミング。新規共通イオン単一定量アルゴリズムにより、多数の実験が分析されている場合、GC-MS電子衝撃(EI)フラグメンテーションスペクトルの自動化された正確な定量化が可能になります。PYMSは、メッセージ通過インターフェイス(MPI)に基づいて順列および列のデータ処理タスクの並列処理を実装し、分散コンピューティング環境で複数のCPUで処理を拡張できるようにします。一連の特異的に設計された実験が社内で実行され、GC-MSデータ処理(AMDIS、AnalyzerPro、およびXCMS)のPYMSと3つの広く使用されているソフトウェアパッケージのパフォーマンスを比較的評価するために使用されました。 結論:PYMSは、RAW GC-MSデータの処理のための新しいソフトウェアパッケージであり、特にカスタマイズされた処理パイプラインのスクリプトとバッチモードのデータ処理に適しています。PYMSは、限られたグラフィカル機能を提供し、日常的なデータ処理とインタラクティブ/探索的データ分析の両方に使用できます。現実のGC-MSデータ処理シナリオでは、Pymsは主要なソフトウェアパッケージよりもパフォーマンスを発揮します。PYMで実装するのは簡単なデータ処理シナリオを実証しますが、多くの従来のGC-MSデータ処理ソフトウェアで達成することは困難です。PYMSによる自動化されたサンプル処理と定量化は、データ処理をグラフィカルユーザーインターフェイスと緊密に統合する、より従来のインタラクティブなソフトウェアシステムと比較して、大幅な時間節約を提供できます。

背景:Gas Chromatography-Mass分光法(GC-MS)は、代謝物の標的および非標的測定で頻繁に使用される手法です。RAW機器GC-MSデータの処理のためのほとんどの既存のソフトウェアツールは、データ処理方法をグラフィカルなユーザーインターフェイスとインタラクティブデータ処理を促進することをしっかりと統合します。GC-MSアプリケーションではインタラクティブ処理が非常に重要なままですが、ハイスループットの研究により、ハイスループットのカスタマイズされた処理パイプラインのスクリプティングに適したコマンドラインツールの必要性がますます指示されています。 結果:PYMSは、Pythonで開発された機器GC-MSデータを処理するための機能ライブラリで構成されています。PYMSは現在、標準データ形式(Andi-MS/NetCDFおよびJCAMP-DX)の読み取り、ノイズスムージング、ベースライン補正、ピーク検出、ピークデコンボリューション、ピーク積分、およびピークアライメントを含むGC-MS処理機能の完全なセットを提供しています。動的プログラミング。新規共通イオン単一定量アルゴリズムにより、多数の実験が分析されている場合、GC-MS電子衝撃(EI)フラグメンテーションスペクトルの自動化された正確な定量化が可能になります。PYMSは、メッセージ通過インターフェイス(MPI)に基づいて順列および列のデータ処理タスクの並列処理を実装し、分散コンピューティング環境で複数のCPUで処理を拡張できるようにします。一連の特異的に設計された実験が社内で実行され、GC-MSデータ処理(AMDIS、AnalyzerPro、およびXCMS)のPYMSと3つの広く使用されているソフトウェアパッケージのパフォーマンスを比較的評価するために使用されました。 結論:PYMSは、RAW GC-MSデータの処理のための新しいソフトウェアパッケージであり、特にカスタマイズされた処理パイプラインのスクリプトとバッチモードのデータ処理に適しています。PYMSは、限られたグラフィカル機能を提供し、日常的なデータ処理とインタラクティブ/探索的データ分析の両方に使用できます。現実のGC-MSデータ処理シナリオでは、Pymsは主要なソフトウェアパッケージよりもパフォーマンスを発揮します。PYMで実装するのは簡単なデータ処理シナリオを実証しますが、多くの従来のGC-MSデータ処理ソフトウェアで達成することは困難です。PYMSによる自動化されたサンプル処理と定量化は、データ処理をグラフィカルユーザーインターフェイスと緊密に統合する、より従来のインタラクティブなソフトウェアシステムと比較して、大幅な時間節約を提供できます。

BACKGROUND: Gas chromatography-mass spectrometry (GC-MS) is a technique frequently used in targeted and non-targeted measurements of metabolites. Most existing software tools for processing of raw instrument GC-MS data tightly integrate data processing methods with graphical user interface facilitating interactive data processing. While interactive processing remains critically important in GC-MS applications, high-throughput studies increasingly dictate the need for command line tools, suitable for scripting of high-throughput, customized processing pipelines. RESULTS: PyMS comprises a library of functions for processing of instrument GC-MS data developed in Python. PyMS currently provides a complete set of GC-MS processing functions, including reading of standard data formats (ANDI- MS/NetCDF and JCAMP-DX), noise smoothing, baseline correction, peak detection, peak deconvolution, peak integration, and peak alignment by dynamic programming. A novel common ion single quantitation algorithm allows automated, accurate quantitation of GC-MS electron impact (EI) fragmentation spectra when a large number of experiments are being analyzed. PyMS implements parallel processing for by-row and by-column data processing tasks based on Message Passing Interface (MPI), allowing processing to scale on multiple CPUs in distributed computing environments. A set of specifically designed experiments was performed in-house and used to comparatively evaluate the performance of PyMS and three widely used software packages for GC-MS data processing (AMDIS, AnalyzerPro, and XCMS). CONCLUSIONS: PyMS is a novel software package for the processing of raw GC-MS data, particularly suitable for scripting of customized processing pipelines and for data processing in batch mode. PyMS provides limited graphical capabilities and can be used both for routine data processing and interactive/exploratory data analysis. In real-life GC-MS data processing scenarios PyMS performs as well or better than leading software packages. We demonstrate data processing scenarios simple to implement in PyMS, yet difficult to achieve with many conventional GC-MS data processing software. Automated sample processing and quantitation with PyMS can provide substantial time savings compared to more traditional interactive software systems that tightly integrate data processing with the graphical user interface.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google