Loading...
BMC medical research methodology2021Apr24Vol.21issue(1)

ラッソタイプのバイナリデータのスプライン回帰

,
,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

背景:通常、相関データの分析に使用される一般化された線形混合モデル(GLMMS)は、回帰スプラインからのノット係数をランダム効果として考慮することにより、平滑化にも使用できます。結果のモデルは、セミパラメトリック混合モデル(SPMMS)と呼ばれます。ランダムな結び目係数が平均ゼロで正規分布に従うことができるようにし、一定の分散は、尾根回帰タイプのペナルティを備えたペナルティ化されたスプラインを使用するのと同等です。平均ゼロのラプラス二重指数分布に従うためにノットの係数を考慮することにより、SPMM設定で最も絶対的な縮小および選択オペレーター(ラッソ)タイプのペナルティを導入します。 方法:ベイジアンアプローチを採用し、モデルフィッティングのためにマルコフチェーンモンテカルロ(MCMC)アルゴリズムを使用します。シミュレーションを通じて、ラッソタイプのペナルティを使用してSPMMでのカーブフィッティングのパフォーマンスを、バイナリデータにRidge Paentyを使用するものと比較します。提案された方法を適用して、喫煙の年数と慢性閉塞性肺疾患(COPD)を発症するリスクとの関係に関するデータから滑らかな曲線を取得します。 結果:ラッソのペナルティは、関連性の単純な形状に対する尾根のペナルティと同様に、関連性の形状が複雑または線形である場合、尾根のペナルティを上回ります。 結論:ラッソのペナルティが、SPMMの尾根ペナルティよりも複雑な用量反応関連を獲得したことを実証しました。

背景:通常、相関データの分析に使用される一般化された線形混合モデル(GLMMS)は、回帰スプラインからのノット係数をランダム効果として考慮することにより、平滑化にも使用できます。結果のモデルは、セミパラメトリック混合モデル(SPMMS)と呼ばれます。ランダムな結び目係数が平均ゼロで正規分布に従うことができるようにし、一定の分散は、尾根回帰タイプのペナルティを備えたペナルティ化されたスプラインを使用するのと同等です。平均ゼロのラプラス二重指数分布に従うためにノットの係数を考慮することにより、SPMM設定で最も絶対的な縮小および選択オペレーター(ラッソ)タイプのペナルティを導入します。 方法:ベイジアンアプローチを採用し、モデルフィッティングのためにマルコフチェーンモンテカルロ(MCMC)アルゴリズムを使用します。シミュレーションを通じて、ラッソタイプのペナルティを使用してSPMMでのカーブフィッティングのパフォーマンスを、バイナリデータにRidge Paentyを使用するものと比較します。提案された方法を適用して、喫煙の年数と慢性閉塞性肺疾患(COPD)を発症するリスクとの関係に関するデータから滑らかな曲線を取得します。 結果:ラッソのペナルティは、関連性の単純な形状に対する尾根のペナルティと同様に、関連性の形状が複雑または線形である場合、尾根のペナルティを上回ります。 結論:ラッソのペナルティが、SPMMの尾根ペナルティよりも複雑な用量反応関連を獲得したことを実証しました。

BACKGROUND: Generalized linear mixed models (GLMMs), typically used for analyzing correlated data, can also be used for smoothing by considering the knot coefficients from a regression spline as random effects. The resulting models are called semiparametric mixed models (SPMMs). Allowing the random knot coefficients to follow a normal distribution with mean zero and a constant variance is equivalent to using a penalized spline with a ridge regression type penalty. We introduce the least absolute shrinkage and selection operator (LASSO) type penalty in the SPMM setting by considering the coefficients at the knots to follow a Laplace double exponential distribution with mean zero. METHODS: We adopt a Bayesian approach and use the Markov Chain Monte Carlo (MCMC) algorithm for model fitting. Through simulations, we compare the performance of curve fitting in a SPMM using a LASSO type penalty to that of using ridge penalty for binary data. We apply the proposed method to obtain smooth curves from data on the relationship between the amount of pack years of smoking and the risk of developing chronic obstructive pulmonary disease (COPD). RESULTS: The LASSO penalty performs as well as ridge penalty for simple shapes of association and outperforms the ridge penalty when the shape of association is complex or linear. CONCLUSION: We demonstrated that LASSO penalty captured complex dose-response association better than the Ridge penalty in a SPMM.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google