Loading...
Epidemiology (Cambridge, Mass.)2018Jan01Vol.29issue(1)

スーパー学習者の予測モデリングを使用して、高次元傾向スコアの推定を改善する

,
,
,
,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

高次元傾向スコアは、電子ヘルスケアデータベースを利用している非発生医学研究の交絡制御を改善するために専門知識を補うことができる半自動化変数選択アルゴリズムです。アルゴリズムを使用して、何百もの患者レベルの変数を生成し、潜在的な交絡の影響によってランク付けすることができますが、調整に最適な数の変数を選択する方法は不明のままです。経験的データに基づいたプラズモードシミュレーションを使用して、高次元傾向スコアと組み合わせて大規模なヘルスケアデータベースの交絡制御を改善するために、可変選択および予測モデリングのデータ適応アプローチを議論および評価しました。高次元傾向スコアをスーパー学習者予測モデリングと組み合わせたアプローチ、共同ターゲットの最大尤度推定のスケーラブルなバージョン、および罰せられた回帰を検討しました。バイアスを使用してパフォーマンスを評価しました。結果は、高次元傾向スコアが調整に含まれる変数の数に敏感であり、傾向スコアモデルの重度の過剰適合が効果推定の特性に悪影響を与える可能性があることを示しました。高次元傾向スコアとスーパー学習者を組み合わせることは、効果の推定値のバイアスとMSEを減らすという点で最も一貫した戦略であり、高次元共変量データセットの半自動化されたデータ適応傾向スコア推定を有望である可能性があります。

高次元傾向スコアは、電子ヘルスケアデータベースを利用している非発生医学研究の交絡制御を改善するために専門知識を補うことができる半自動化変数選択アルゴリズムです。アルゴリズムを使用して、何百もの患者レベルの変数を生成し、潜在的な交絡の影響によってランク付けすることができますが、調整に最適な数の変数を選択する方法は不明のままです。経験的データに基づいたプラズモードシミュレーションを使用して、高次元傾向スコアと組み合わせて大規模なヘルスケアデータベースの交絡制御を改善するために、可変選択および予測モデリングのデータ適応アプローチを議論および評価しました。高次元傾向スコアをスーパー学習者予測モデリングと組み合わせたアプローチ、共同ターゲットの最大尤度推定のスケーラブルなバージョン、および罰せられた回帰を検討しました。バイアスを使用してパフォーマンスを評価しました。結果は、高次元傾向スコアが調整に含まれる変数の数に敏感であり、傾向スコアモデルの重度の過剰適合が効果推定の特性に悪影響を与える可能性があることを示しました。高次元傾向スコアとスーパー学習者を組み合わせることは、効果の推定値のバイアスとMSEを減らすという点で最も一貫した戦略であり、高次元共変量データセットの半自動化されたデータ適応傾向スコア推定を有望である可能性があります。

The high-dimensional propensity score is a semiautomated variable selection algorithm that can supplement expert knowledge to improve confounding control in nonexperimental medical studies utilizing electronic healthcare databases. Although the algorithm can be used to generate hundreds of patient-level variables and rank them by their potential confounding impact, it remains unclear how to select the optimal number of variables for adjustment. We used plasmode simulations based on empirical data to discuss and evaluate data-adaptive approaches for variable selection and prediction modeling that can be combined with the high-dimensional propensity score to improve confounding control in large healthcare databases. We considered approaches that combine the high-dimensional propensity score with Super Learner prediction modeling, a scalable version of collaborative targeted maximum-likelihood estimation, and penalized regression. We evaluated performance using bias and mean squared error (MSE) in effect estimates. Results showed that the high-dimensional propensity score can be sensitive to the number of variables included for adjustment and that severe overfitting of the propensity score model can negatively impact the properties of effect estimates. Combining the high-dimensional propensity score with Super Learner was the most consistent strategy, in terms of reducing bias and MSE in the effect estimates, and may be promising for semiautomated data-adaptive propensity score estimation in high-dimensional covariate datasets.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google