Loading...
Ecology and evolution2022Jul01Vol.12issue(7)

固定またはランダム?グループ化変数における少数のレベルの混合効果モデルの信頼性について

,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

生物学的データは、しばしば本質的に階層的であり(例:異なる属の種、異なる山脈地域内の植物)、混合効果が非独立性を説明できるため、生態学と進化の共通の分析ツールにモデル化しました。実際のアプリケーションに関する多くの質問は解決されますが、1つはまだ議論されています。レベルの数が少ないグループ変数をランダムまたは固定効果として扱う必要がありますか?このような状況では、ランダム効果の分散推定は不正確になる可能性がありますが、これが目的の固定効果の統計的なパワーとタイプIエラー率に影響するかどうかは不明です。ここでは、2〜8レベルのグループ変数を正しく指定されたモデルおよび代替モデル(過小またはオーバーパラム化されたモデル)で固定またはランダム効果として扱うことの結果を分析しました。すべてのモデル仕様のタイプIエラー率と統計力を計算し、これらの量に対する研究デザインの影響を定量化しました。ランダムインターセプトのみのモデルのタイプIエラー率と人口レベル効果(勾配)に対するモデル選択の影響はありませんでした。ただし、データ生成プロセスのインターセプトと勾配が変化し、ランダムな勾配とインターセプトモデルを使用して、特異な適合の場合に固定効果モデルに切り替えると、結果の自信が伴うことがなくなります。さらに、レベル間の数と違いは、パワーとタイプIのエラーに強く影響します。正しいランダム効果構造を推測することは、正しいタイプIエラー率を得るために非常に重要であると結論付けています。グループ化変数のレベルの数とは無関係に、混合効果モデルから始めて、特異な適合の場合にのみ固定効果モデルに切り替えることをお勧めします。これらの推奨事項により、研究デザインとデータ分析に関するより有益な選択が可能になり、混合効果モデルを使用した生態学的推論が少数のレベルに対してより堅牢になります。

生物学的データは、しばしば本質的に階層的であり(例:異なる属の種、異なる山脈地域内の植物)、混合効果が非独立性を説明できるため、生態学と進化の共通の分析ツールにモデル化しました。実際のアプリケーションに関する多くの質問は解決されますが、1つはまだ議論されています。レベルの数が少ないグループ変数をランダムまたは固定効果として扱う必要がありますか?このような状況では、ランダム効果の分散推定は不正確になる可能性がありますが、これが目的の固定効果の統計的なパワーとタイプIエラー率に影響するかどうかは不明です。ここでは、2〜8レベルのグループ変数を正しく指定されたモデルおよび代替モデル(過小またはオーバーパラム化されたモデル)で固定またはランダム効果として扱うことの結果を分析しました。すべてのモデル仕様のタイプIエラー率と統計力を計算し、これらの量に対する研究デザインの影響を定量化しました。ランダムインターセプトのみのモデルのタイプIエラー率と人口レベル効果(勾配)に対するモデル選択の影響はありませんでした。ただし、データ生成プロセスのインターセプトと勾配が変化し、ランダムな勾配とインターセプトモデルを使用して、特異な適合の場合に固定効果モデルに切り替えると、結果の自信が伴うことがなくなります。さらに、レベル間の数と違いは、パワーとタイプIのエラーに強く影響します。正しいランダム効果構造を推測することは、正しいタイプIエラー率を得るために非常に重要であると結論付けています。グループ化変数のレベルの数とは無関係に、混合効果モデルから始めて、特異な適合の場合にのみ固定効果モデルに切り替えることをお勧めします。これらの推奨事項により、研究デザインとデータ分析に関するより有益な選択が可能になり、混合効果モデルを使用した生態学的推論が少数のレベルに対してより堅牢になります。

Biological data are often intrinsically hierarchical (e.g., species from different genera, plants within different mountain regions), which made mixed-effects models a common analysis tool in ecology and evolution because they can account for the non-independence. Many questions around their practical applications are solved but one is still debated: Should we treat a grouping variable with a low number of levels as a random or fixed effect? In such situations, the variance estimate of the random effect can be imprecise, but it is unknown if this affects statistical power and type I error rates of the fixed effects of interest. Here, we analyzed the consequences of treating a grouping variable with 2-8 levels as fixed or random effect in correctly specified and alternative models (under- or overparametrized models). We calculated type I error rates and statistical power for all-model specifications and quantified the influences of study design on these quantities. We found no influence of model choice on type I error rate and power on the population-level effect (slope) for random intercept-only models. However, with varying intercepts and slopes in the data-generating process, using a random slope and intercept model, and switching to a fixed-effects model, in case of a singular fit, avoids overconfidence in the results. Additionally, the number and difference between levels strongly influences power and type I error. We conclude that inferring the correct random-effect structure is of great importance to obtain correct type I error rates. We encourage to start with a mixed-effects model independent of the number of levels in the grouping variable and switch to a fixed-effects model only in case of a singular fit. With these recommendations, we allow for more informative choices about study design and data analysis and make ecological inference with mixed-effects models more robust for small number of levels.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google