Loading...
The Analyst2011Apr21Vol.136issue(8)

サポートベクターマシン回帰(SVR/LS-SVM) - 分析化学のためのニューラルネットワーク(ANN)に代わるものですか?近赤外(NIR)分光法の非線形法の比較データ

,
,
文献タイプ:
  • Comparative Study
  • Journal Article
概要
Abstract

この研究では、5つの多変量キャリブレーションモデルの精度と堅牢性の一般的な比較を行います。潜在的な構造への部分的最小二乗(PLS)回帰または投影、多項式部分最小二乗(ポリ-PLS)回帰、人工ニューラルネットワーク(ANN)、および多変量データ分析のためのサポートベクターマシン(SVM)に基づく2つの新しい手法:サポートベクター回帰(SVR)と最小二乗サポートベクターマシン(LS-SVM)。比較は、14セットのガソリンデータ(密度、ベンゼン含有量、および分数組成/沸点)の7セット、2セットのエタノールガソリン燃料データ(密度とエタノール含有量)、ディーゼル燃料の1セットに基づいています。データ(合計硫黄含有量)、3セットの石油(原油)高分子データ(アスファルテン、樹脂、パラフィンの重量率)、および1セットの石油樹脂データ(樹脂の含有量)。振動(近赤外、NIR)分光データを使用して、ガソリン、バイオ燃料/バイオディーゼル、ディーゼル燃料、およびその他の関心のあるサンプルの特性と品質係数を予測します。ここで紹介する4つのシステムは、組成、特性、分子間相互作用の強度(例えば、ファンデルワールス力、H結合)、コロイド構造、および相の範囲にあります。研究された化学システムの多様性が高いため、SVM回帰法に関する一般的な結論を出すことができます。次の質問に答えようとします。SVMベースの手法は、現実世界(産業/科学)アプリケーションのANNベースのアプローチにどの程度置き換えることができますか?結果は、SVRとLS-SVMメソッドの両方が精度のANNに匹敵することを示しています。前者の堅牢性がはるかに高いため、SVMベースのアプローチは実用的な(産業)アプリケーションに推奨されます。これは、複雑で非常に非線形のオブジェクトに特に当てはまることが示されています。

この研究では、5つの多変量キャリブレーションモデルの精度と堅牢性の一般的な比較を行います。潜在的な構造への部分的最小二乗(PLS)回帰または投影、多項式部分最小二乗(ポリ-PLS)回帰、人工ニューラルネットワーク(ANN)、および多変量データ分析のためのサポートベクターマシン(SVM)に基づく2つの新しい手法:サポートベクター回帰(SVR)と最小二乗サポートベクターマシン(LS-SVM)。比較は、14セットのガソリンデータ(密度、ベンゼン含有量、および分数組成/沸点)の7セット、2セットのエタノールガソリン燃料データ(密度とエタノール含有量)、ディーゼル燃料の1セットに基づいています。データ(合計硫黄含有量)、3セットの石油(原油)高分子データ(アスファルテン、樹脂、パラフィンの重量率)、および1セットの石油樹脂データ(樹脂の含有量)。振動(近赤外、NIR)分光データを使用して、ガソリン、バイオ燃料/バイオディーゼル、ディーゼル燃料、およびその他の関心のあるサンプルの特性と品質係数を予測します。ここで紹介する4つのシステムは、組成、特性、分子間相互作用の強度(例えば、ファンデルワールス力、H結合)、コロイド構造、および相の範囲にあります。研究された化学システムの多様性が高いため、SVM回帰法に関する一般的な結論を出すことができます。次の質問に答えようとします。SVMベースの手法は、現実世界(産業/科学)アプリケーションのANNベースのアプローチにどの程度置き換えることができますか?結果は、SVRとLS-SVMメソッドの両方が精度のANNに匹敵することを示しています。前者の堅牢性がはるかに高いため、SVMベースのアプローチは実用的な(産業)アプリケーションに推奨されます。これは、複雑で非常に非線形のオブジェクトに特に当てはまることが示されています。

In this study, we make a general comparison of the accuracy and robustness of five multivariate calibration models: partial least squares (PLS) regression or projection to latent structures, polynomial partial least squares (Poly-PLS) regression, artificial neural networks (ANNs), and two novel techniques based on support vector machines (SVMs) for multivariate data analysis: support vector regression (SVR) and least-squares support vector machines (LS-SVMs). The comparison is based on fourteen (14) different datasets: seven sets of gasoline data (density, benzene content, and fractional composition/boiling points), two sets of ethanol gasoline fuel data (density and ethanol content), one set of diesel fuel data (total sulfur content), three sets of petroleum (crude oil) macromolecules data (weight percentages of asphaltenes, resins, and paraffins), and one set of petroleum resins data (resins content). Vibrational (near-infrared, NIR) spectroscopic data are used to predict the properties and quality coefficients of gasoline, biofuel/biodiesel, diesel fuel, and other samples of interest. The four systems presented here range greatly in composition, properties, strength of intermolecular interactions (e.g., van der Waals forces, H-bonds), colloid structure, and phase behavior. Due to the high diversity of chemical systems studied, general conclusions about SVM regression methods can be made. We try to answer the following question: to what extent can SVM-based techniques replace ANN-based approaches in real-world (industrial/scientific) applications? The results show that both SVR and LS-SVM methods are comparable to ANNs in accuracy. Due to the much higher robustness of the former, the SVM-based approaches are recommended for practical (industrial) application. This has been shown to be especially true for complicated, highly nonlinear objects.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google