Loading...
BMC bioinformatics2008Feb19Vol.9issue()

K-Oplsパッケージ:機能空間での予測と解釈のための潜在構造へのカーネルベースの直交投影

,
,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

背景:カーネルベースの分類および回帰方法は、さまざまな生物学的データのモデリングに成功裏に適用されています。潜在構造(K-OPLS)メソッドへのカーネルベースの直交投影は、特徴空間の予測変動と構造化ノイズの個別のモデリングを促進するユニークな特性を提供します。他のカーネルベースの方法と同様の予測結果を提供する一方で、K-OPLSは解釈能力を強化しています。機器のドリフト、バッチの変動、または予期しない生物学的変動などのデータの予期しない系統的変動の検出を可能にします。 結果:gnu gplの下でライセンスされ、http://www.sourceforge.net/projects/kopls/で入手可能、MATLABおよびRのK-OPLSアルゴリズムの実装を実証します。パッケージには、モデル評価(相互検証を使用)、トレーニング、将来のサンプルの予測のための重要な機能とドキュメントが含まれています。Incorporatedは、データの視覚化を簡素化するための診断ツールとプロット機能のセットでもあります。傾向を検出するため、または範囲のサンプルの識別用。ソフトウェアパッケージの有用性は、ハイブリッドアスペンの生物学的研究からの代謝プロファイリングデータセットによって実証されています。 結論:K-OPLS法の特性は、生物学的データの分析に適しています。これは、概説されたオープンソースパッケージの可用性と併せて、バイオインフォマティクスアプリケーションのカーネルベースの分析のための包括的なソリューションを提供します。

背景:カーネルベースの分類および回帰方法は、さまざまな生物学的データのモデリングに成功裏に適用されています。潜在構造(K-OPLS)メソッドへのカーネルベースの直交投影は、特徴空間の予測変動と構造化ノイズの個別のモデリングを促進するユニークな特性を提供します。他のカーネルベースの方法と同様の予測結果を提供する一方で、K-OPLSは解釈能力を強化しています。機器のドリフト、バッチの変動、または予期しない生物学的変動などのデータの予期しない系統的変動の検出を可能にします。 結果:gnu gplの下でライセンスされ、http://www.sourceforge.net/projects/kopls/で入手可能、MATLABおよびRのK-OPLSアルゴリズムの実装を実証します。パッケージには、モデル評価(相互検証を使用)、トレーニング、将来のサンプルの予測のための重要な機能とドキュメントが含まれています。Incorporatedは、データの視覚化を簡素化するための診断ツールとプロット機能のセットでもあります。傾向を検出するため、または範囲のサンプルの識別用。ソフトウェアパッケージの有用性は、ハイブリッドアスペンの生物学的研究からの代謝プロファイリングデータセットによって実証されています。 結論:K-OPLS法の特性は、生物学的データの分析に適しています。これは、概説されたオープンソースパッケージの可用性と併せて、バイオインフォマティクスアプリケーションのカーネルベースの分析のための包括的なソリューションを提供します。

BACKGROUND: Kernel-based classification and regression methods have been successfully applied to modelling a wide variety of biological data. The Kernel-based Orthogonal Projections to Latent Structures (K-OPLS) method offers unique properties facilitating separate modelling of predictive variation and structured noise in the feature space. While providing prediction results similar to other kernel-based methods, K-OPLS features enhanced interpretational capabilities; allowing detection of unanticipated systematic variation in the data such as instrumental drift, batch variability or unexpected biological variation. RESULTS: We demonstrate an implementation of the K-OPLS algorithm for MATLAB and R, licensed under the GNU GPL and available at http://www.sourceforge.net/projects/kopls/. The package includes essential functionality and documentation for model evaluation (using cross-validation), training and prediction of future samples. Incorporated is also a set of diagnostic tools and plot functions to simplify the visualisation of data, e.g. for detecting trends or for identification of outlying samples. The utility of the software package is demonstrated by means of a metabolic profiling data set from a biological study of hybrid aspen. CONCLUSION: The properties of the K-OPLS method are well suited for analysis of biological data, which in conjunction with the availability of the outlined open-source package provides a comprehensive solution for kernel-based analysis in bioinformatics applications.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google