Loading...
Methods in molecular biology (Clifton, N.J.)20130101Vol.930issue()

部分的な最小二乗法:部分的な最小二乗相関と部分的な最小二乗回帰

,
,
文献タイプ:
  • Journal Article
概要
Abstract

部分的な最小二乗(PLS)メソッド(潜在構造への投影とも呼ばれることもあります)は、同じ観測セットの測定値を収集する2つのデータテーブルに存在する情報を関連付けます。PLSメソッドは、データテーブルの変数の(最適な)線形結合である潜在変数を導出することにより進みます。目標が2つのテーブル間で共有情報を見つけることである場合、アプローチは相関問題と同等であり、手法は部分的最小二乗相関(PLSC)と呼ばれます(PLS-SVDとも呼ばれることもあります)。この場合、潜在変数の2つのセット(テーブルごとに1つのセット)があり、これらの潜在変数は最大の共分散を持つために必要です。目標が1つのデータテーブルを予測することである場合、もう1つのデータテーブルを予測する場合、手法は部分的な最小二乗回帰と呼ばれます。この場合、潜在変数のセット(予測テーブルから派生)が1つあり、これらの潜在変数は可能な限り最良の予測を提供するために必要です。この論文では、PLSCとPLSRを提示して説明し、これらの記述的多変量解析手法をどのように拡張して、ブートストラップや順位テストなどの交差検証技術を使用して推論の質問に対処する方法を示します。

部分的な最小二乗(PLS)メソッド(潜在構造への投影とも呼ばれることもあります)は、同じ観測セットの測定値を収集する2つのデータテーブルに存在する情報を関連付けます。PLSメソッドは、データテーブルの変数の(最適な)線形結合である潜在変数を導出することにより進みます。目標が2つのテーブル間で共有情報を見つけることである場合、アプローチは相関問題と同等であり、手法は部分的最小二乗相関(PLSC)と呼ばれます(PLS-SVDとも呼ばれることもあります)。この場合、潜在変数の2つのセット(テーブルごとに1つのセット)があり、これらの潜在変数は最大の共分散を持つために必要です。目標が1つのデータテーブルを予測することである場合、もう1つのデータテーブルを予測する場合、手法は部分的な最小二乗回帰と呼ばれます。この場合、潜在変数のセット(予測テーブルから派生)が1つあり、これらの潜在変数は可能な限り最良の予測を提供するために必要です。この論文では、PLSCとPLSRを提示して説明し、これらの記述的多変量解析手法をどのように拡張して、ブートストラップや順位テストなどの交差検証技術を使用して推論の質問に対処する方法を示します。

Partial least square (PLS) methods (also sometimes called projection to latent structures) relate the information present in two data tables that collect measurements on the same set of observations. PLS methods proceed by deriving latent variables which are (optimal) linear combinations of the variables of a data table. When the goal is to find the shared information between two tables, the approach is equivalent to a correlation problem and the technique is then called partial least square correlation (PLSC) (also sometimes called PLS-SVD). In this case there are two sets of latent variables (one set per table), and these latent variables are required to have maximal covariance. When the goal is to predict one data table the other one, the technique is then called partial least square regression. In this case there is one set of latent variables (derived from the predictor table) and these latent variables are required to give the best possible prediction. In this paper we present and illustrate PLSC and PLSR and show how these descriptive multivariate analysis techniques can be extended to deal with inferential questions by using cross-validation techniques such as the bootstrap and permutation tests.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google