Loading...
Biometrical journal. Biometrische Zeitschrift2023Feb01Vol.65issue(2)

平均因果効果の逆確率重み付け推定器のためのモデルの誤りとバイアス

,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

因果効果の一般的に使用されるセミパラメトリック推定器は、傾向スコア(PS)と条件付き結果のパラメトリックモデルを指定します。例としては、2つのモデルのうち少なくとも1つが正しく指定されている場合に一貫性があるため、頻繁に二重堅牢な推定器と呼ばれる逆確率重み付け(IPW)推定器が増強されています。ただし、多くの観察研究では、パラメトリックモデルの役割は、データを生成するプロセスの表現を提供するのではなく、交絡の調整を容易にすることであり、少なくとも1つの真のモデルを保持する可能性が低いと仮定することです。この論文では、モデルがデータ生成プロセスの近似であると想定される場合、つまりすべてのモデルが誤っている場合の推定器の大規模なサンプルバイアスを研究するための粗い分析アプローチを提案します。アウトカム回帰(OR)およびPSの誤った指導モデルを使用して、誤って指定されたPSモデルを使用して、平均因果効果の3つのプロトタイプ推定器、2つのIPW推定器、および拡張IPW(AIPW)推定器にアプローチを適用します。2つのIPW推定器の場合、分散が小さくなることに加えて、モデルの誤りによるバイアスに対するある程度の保護も提供することを示しています。2つの誤った指定されたモデルの使用が、AIPW推定器が単純なIPW推定器よりも小さいバイアスを持っている場合、および正規化された重みを持つIPW推定器よりも小さいバイアスを持っている場合に必要な条件を導き出すものよりも優れている場合の問題を分析するために。結果モデルの誤りが中程度である場合、IPWとAIPW推定器のバイアスの比較は、AIPW推定器がIPW推定器よりも小さいバイアスを持っていることを示しています。ただし、すべてのバイアスにはPSモデルエラーによるスケーリングが含まれており、そのようなモデルが関係する場合はいつでもPSをモデル化することに注意することをお勧めします。数値および有限のサンプルイラストには、3つのシミュレーション研究と大規模なバイアスの対応する近似を含めます。National Health and Nutrition rusection Surveyのデータセットでは、血液鉛濃度に対する喫煙の影響を推定しています。

因果効果の一般的に使用されるセミパラメトリック推定器は、傾向スコア(PS)と条件付き結果のパラメトリックモデルを指定します。例としては、2つのモデルのうち少なくとも1つが正しく指定されている場合に一貫性があるため、頻繁に二重堅牢な推定器と呼ばれる逆確率重み付け(IPW)推定器が増強されています。ただし、多くの観察研究では、パラメトリックモデルの役割は、データを生成するプロセスの表現を提供するのではなく、交絡の調整を容易にすることであり、少なくとも1つの真のモデルを保持する可能性が低いと仮定することです。この論文では、モデルがデータ生成プロセスの近似であると想定される場合、つまりすべてのモデルが誤っている場合の推定器の大規模なサンプルバイアスを研究するための粗い分析アプローチを提案します。アウトカム回帰(OR)およびPSの誤った指導モデルを使用して、誤って指定されたPSモデルを使用して、平均因果効果の3つのプロトタイプ推定器、2つのIPW推定器、および拡張IPW(AIPW)推定器にアプローチを適用します。2つのIPW推定器の場合、分散が小さくなることに加えて、モデルの誤りによるバイアスに対するある程度の保護も提供することを示しています。2つの誤った指定されたモデルの使用が、AIPW推定器が単純なIPW推定器よりも小さいバイアスを持っている場合、および正規化された重みを持つIPW推定器よりも小さいバイアスを持っている場合に必要な条件を導き出すものよりも優れている場合の問題を分析するために。結果モデルの誤りが中程度である場合、IPWとAIPW推定器のバイアスの比較は、AIPW推定器がIPW推定器よりも小さいバイアスを持っていることを示しています。ただし、すべてのバイアスにはPSモデルエラーによるスケーリングが含まれており、そのようなモデルが関係する場合はいつでもPSをモデル化することに注意することをお勧めします。数値および有限のサンプルイラストには、3つのシミュレーション研究と大規模なバイアスの対応する近似を含めます。National Health and Nutrition rusection Surveyのデータセットでは、血液鉛濃度に対する喫煙の影響を推定しています。

Commonly used semiparametric estimators of causal effects specify parametric models for the propensity score (PS) and the conditional outcome. An example is an augmented inverse probability weighting (IPW) estimator, frequently referred to as a doubly robust estimator, because it is consistent if at least one of the two models is correctly specified. However, in many observational studies, the role of the parametric models is often not to provide a representation of the data-generating process but rather to facilitate the adjustment for confounding, making the assumption of at least one true model unlikely to hold. In this paper, we propose a crude analytical approach to study the large-sample bias of estimators when the models are assumed to be approximations of the data-generating process, namely, when all models are misspecified. We apply our approach to three prototypical estimators of the average causal effect, two IPW estimators, using a misspecified PS model, and an augmented IPW (AIPW) estimator, using misspecified models for the outcome regression (OR) and the PS. For the two IPW estimators, we show that normalization, in addition to having a smaller variance, also offers some protection against bias due to model misspecification. To analyze the question of when the use of two misspecified models is better than one we derive necessary and sufficient conditions for when the AIPW estimator has a smaller bias than a simple IPW estimator and when it has a smaller bias than an IPW estimator with normalized weights. If the misspecification of the outcome model is moderate, the comparisons of the biases of the IPW and AIPW estimators show that the AIPW estimator has a smaller bias than the IPW estimators. However, all biases include a scaling with the PS-model error and we suggest caution in modeling the PS whenever such a model is involved. For numerical and finite sample illustrations, we include three simulation studies and corresponding approximations of the large-sample biases. In a dataset from the National Health and Nutrition Examination Survey, we estimate the effect of smoking on blood lead levels.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google