著名医師による解説が無料で読めます
すると翻訳の精度が向上します
背景:最新の因果推論方法により、機械学習を使用してパラメトリックモデリングの仮定を弱めることができます。ただし、機械学習を使用すると、推論の合併症が発生する可能性があります。より良い統計的特性を生成するために、二重に堅牢なクロスフィット推定器が提案されています。 方法:平均因果効果についていくつかの異なる推定器の性能を評価するために、シミュレーション研究を実施しました。シミュレートされた治療と結果のデータ生成メカニズムには、対数変換、多項式用語、および不連続性が含まれます。単独で堅牢な推定器(Gコンピューション、逆確率の重み付け)と二重堅牢な推定器(逆確率重み付けが増強され、ターゲットの最尤推定)を比較しました。パラメトリックモデルとアンサンブル機械学習を備えた迷惑機能を個別に推定しました。さらに、二重に堅牢なクロスフィット推定器を評価しました。 結果:正しく指定されたパラメトリックモデルにより、すべての推定器は公平であり、信頼区間は名目上のカバレッジを達成しました。機械学習で使用すると、二重に堅牢なクロスフィット推定器は、バイアス、分散、および信頼区間カバレッジに関して、他のすべての推定器を大幅に上回りました。 結論:高次元データでパラメトリックモデルを適切に指定するのが難しいため、アンサンブル学習とクロスフィッティングを伴う二重に堅牢な推定器は、ほとんどの疫学研究で平均因果効果を推定するための好ましいアプローチである可能性があります。ただし、これらのアプローチでは、有限サンプルの問題を回避するために、より大きなサンプルサイズが必要になる場合があります。
背景:最新の因果推論方法により、機械学習を使用してパラメトリックモデリングの仮定を弱めることができます。ただし、機械学習を使用すると、推論の合併症が発生する可能性があります。より良い統計的特性を生成するために、二重に堅牢なクロスフィット推定器が提案されています。 方法:平均因果効果についていくつかの異なる推定器の性能を評価するために、シミュレーション研究を実施しました。シミュレートされた治療と結果のデータ生成メカニズムには、対数変換、多項式用語、および不連続性が含まれます。単独で堅牢な推定器(Gコンピューション、逆確率の重み付け)と二重堅牢な推定器(逆確率重み付けが増強され、ターゲットの最尤推定)を比較しました。パラメトリックモデルとアンサンブル機械学習を備えた迷惑機能を個別に推定しました。さらに、二重に堅牢なクロスフィット推定器を評価しました。 結果:正しく指定されたパラメトリックモデルにより、すべての推定器は公平であり、信頼区間は名目上のカバレッジを達成しました。機械学習で使用すると、二重に堅牢なクロスフィット推定器は、バイアス、分散、および信頼区間カバレッジに関して、他のすべての推定器を大幅に上回りました。 結論:高次元データでパラメトリックモデルを適切に指定するのが難しいため、アンサンブル学習とクロスフィッティングを伴う二重に堅牢な推定器は、ほとんどの疫学研究で平均因果効果を推定するための好ましいアプローチである可能性があります。ただし、これらのアプローチでは、有限サンプルの問題を回避するために、より大きなサンプルサイズが必要になる場合があります。
BACKGROUND: Modern causal inference methods allow machine learning to be used to weaken parametric modeling assumptions. However, the use of machine learning may result in complications for inference. Doubly robust cross-fit estimators have been proposed to yield better statistical properties. METHODS: We conducted a simulation study to assess the performance of several different estimators for the average causal effect. The data generating mechanisms for the simulated treatment and outcome included log-transforms, polynomial terms, and discontinuities. We compared singly robust estimators (g-computation, inverse probability weighting) and doubly robust estimators (augmented inverse probability weighting, targeted maximum likelihood estimation). We estimated nuisance functions with parametric models and ensemble machine learning separately. We further assessed doubly robust cross-fit estimators. RESULTS: With correctly specified parametric models, all of the estimators were unbiased and confidence intervals achieved nominal coverage. When used with machine learning, the doubly robust cross-fit estimators substantially outperformed all of the other estimators in terms of bias, variance, and confidence interval coverage. CONCLUSIONS: Due to the difficulty of properly specifying parametric models in high-dimensional data, doubly robust estimators with ensemble learning and cross-fitting may be the preferred approach for estimation of the average causal effect in most epidemiologic studies. However, these approaches may require larger sample sizes to avoid finite-sample issues.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。