Loading...
Spectrochimica acta. Part A, Molecular and biomolecular spectroscopy2023Jun20Vol.302issue()

テンソル製品ベースの2-D相関データ中国の手作り論文のラマン分光法のための前処理方法

,
,
,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

このペーパーでは、中国の手作り紙サンプルを分析するためのラマン分光法を前処理するために、2つの新しい方法、すなわち、交差相関法(CCM)と2次元相関法(TDCM)を紹介します。CCMは、同じカテゴリの2つのスペクトルデータ間で相互相関を取ることにより、スペクトル寸法を1×Nから1×2N-1に拡張します。TDCMには、2次元の同期相関法(TDSCM)と2次元の非同期相関法(TDACM)が含まれます。これにより、2つのスペクトルデータ間でテンソル製品を摂取することにより、1×NからN×Nにスペクトル寸法が拡張されます。それぞれ同じカテゴリの他のスペクトルデータのヒルベルト変換。実験データは、ベースライン除去、CCM、TDSCM、およびTDACMメソッドを使用して前処理されました。これらの方法の効果を評価するために4つの機械学習モデルが採用されました。線形回帰(LR)と組み合わせた主成分分析(PCA)、LR、K-Nearest Neighbors(KNN)、およびランダムフォレストと組み合わせたサポートベクターマシン(SVM)。rf)。結果は、PCAモデルのR二乗値がすべてのタイプのデータに対してほぼ1であり、高い精度を示していることを示しています。ただし、SVM-LR、KNN、およびRFモデルの場合、R-squared値は、RAWデータ、ベースライン除去データ、CCM、TDSCM、およびTDACMの前処理データの順序でソートされました。TDACM前処理データのKNNおよびRF機械学習モデルのR二乗値は1に近づいており、機械学習の精度がほぼ100%改善されたことを示しています。これにより、KNNやRFなどの監視されたモデルの精度が著しく改善され、PCAなどの監視されていないモデルのレベルに近づきました。

このペーパーでは、中国の手作り紙サンプルを分析するためのラマン分光法を前処理するために、2つの新しい方法、すなわち、交差相関法(CCM)と2次元相関法(TDCM)を紹介します。CCMは、同じカテゴリの2つのスペクトルデータ間で相互相関を取ることにより、スペクトル寸法を1×Nから1×2N-1に拡張します。TDCMには、2次元の同期相関法(TDSCM)と2次元の非同期相関法(TDACM)が含まれます。これにより、2つのスペクトルデータ間でテンソル製品を摂取することにより、1×NからN×Nにスペクトル寸法が拡張されます。それぞれ同じカテゴリの他のスペクトルデータのヒルベルト変換。実験データは、ベースライン除去、CCM、TDSCM、およびTDACMメソッドを使用して前処理されました。これらの方法の効果を評価するために4つの機械学習モデルが採用されました。線形回帰(LR)と組み合わせた主成分分析(PCA)、LR、K-Nearest Neighbors(KNN)、およびランダムフォレストと組み合わせたサポートベクターマシン(SVM)。rf)。結果は、PCAモデルのR二乗値がすべてのタイプのデータに対してほぼ1であり、高い精度を示していることを示しています。ただし、SVM-LR、KNN、およびRFモデルの場合、R-squared値は、RAWデータ、ベースライン除去データ、CCM、TDSCM、およびTDACMの前処理データの順序でソートされました。TDACM前処理データのKNNおよびRF機械学習モデルのR二乗値は1に近づいており、機械学習の精度がほぼ100%改善されたことを示しています。これにより、KNNやRFなどの監視されたモデルの精度が著しく改善され、PCAなどの監視されていないモデルのレベルに近づきました。

The paper introduces two new methods, namely the cross correlation method (CCM) and two-dimensional correlation method (TDCM), for preprocessing Raman spectroscopy data for analyzing Chinese handmade paper samples. CCM expands the spectral dimension from 1×N to 1×2N-1 by taking cross-correlation between two spectral data of the same category. TDCM includes two-dimensional synchronous correlation method (TDSCM) and two-dimensional asynchronous correlation method (TDACM), which expand the spectral dimension from 1×N to N×N by taking tensor products between two spectral data and between one spectral data and the Hilbert transformation of the other spectral data of the same category, respectively. The experimental data were preprocessed using baseline removal, CCM, TDSCM, and TDACM methods. Four machine learning models were employed to evaluate the effects of these methods: principal component analysis (PCA) combined with linear regression (LR), support vector machine (SVM) combined with LR, k-Nearest Neighbors (KNN), and random forest (RF). The results show that the R-squared values for the PCA model were nearly 1 for all types of data, indicating high accuracy. However, for SVM-LR, KNN, and RF models, the R-squared values were sorted in the order of raw data, baseline removal data, CCM, TDSCM, and TDACM preprocessed data. The R-squared values of KNN and RF machine learning models for TDACM preprocessed data were approaching 1, indicating that the accuracy of machine learning was significantly improved by nearly 100%. This has led to a remarkable improvement in the accuracy of supervised models such as KNN and RF, bringing them closer to the level of unsupervised models such as PCA.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google