Loading...
The Journal of animal ecology2020Dec01Vol.89issue(12)

生物学的プロセスと平均センタリングによって明らかにされた統計分析との衝突

,
,
,
,
,
,
,
,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
  • Research Support, U.S. Gov't, Non-P.H.S.
概要
Abstract

動物生態学者はしばしば階層構造化されたデータを収集し、線形混合効果モデルでこれらを分析します。共変量の効果サイズが複数のレベルで異なる場合(例えば、被験者間で)特定の合併症が発生します。被験者内の共変量の平均的中心は、そのような状況で有用なアプローチを提供しますが、問題がないわけではありません。統計モデルは、基礎となる生物学的プロセスに関する仮説を表します。クラスター内の平均センタリングは、より低いレベルの応答(被験者内など)は、共変量の絶対スケールではなく、被験者平均(相対)からの偏差に依存することを前提としています。これは生物学的に現実的である場合とそうでない場合があります。生成(つまり生物学的)プロセスの性質と統計分析の形式との間の不一致が、経験主義者にとって主要な概念的および運用上の課題を生み出すことを示しています。3つの応答を生成するプロセスでデータをシミュレートすることにより、共変量と応答の相関の原因が異なることにより、不一致の結果を調査しました。これらのデータは、3つの異なる分析方程式によって分析されました。分析方程式がどのように重要なパラメーターを推定し、どのような状況がどのようにバイアスが発生するかを尋ねました。生成と分析方程式の間の不一致は、重要なパラメーターを推定するためにいくつかの扱いにくい問題をもたらしました。最も広く誤った推定されたパラメーターは、応答の被験者間の差異でした。すべての方程式によって生成されたすべてのパラメーターを推定する際に、単一の分析方程式が堅牢であることがわかりました。重要なことに、応答生成方程式と分析方程式が数学的に一致した場合でも、共変量の範囲全体でサンプリングすると、いくつかのパラメーターのバイアスが発生しました。私たちの結果は、データの収集と分析方法に一般的な意味を持っています。また、データの統計分析からの結論は、私たちが測定する属性を生成するプロセスに対して、仮説を条件とすることを条件としていることを私たちに思い出させます。基礎となる生物学的プロセスに関する不確実性に直面して、実際のデータ分析のための戦略について説明します。

動物生態学者はしばしば階層構造化されたデータを収集し、線形混合効果モデルでこれらを分析します。共変量の効果サイズが複数のレベルで異なる場合(例えば、被験者間で)特定の合併症が発生します。被験者内の共変量の平均的中心は、そのような状況で有用なアプローチを提供しますが、問題がないわけではありません。統計モデルは、基礎となる生物学的プロセスに関する仮説を表します。クラスター内の平均センタリングは、より低いレベルの応答(被験者内など)は、共変量の絶対スケールではなく、被験者平均(相対)からの偏差に依存することを前提としています。これは生物学的に現実的である場合とそうでない場合があります。生成(つまり生物学的)プロセスの性質と統計分析の形式との間の不一致が、経験主義者にとって主要な概念的および運用上の課題を生み出すことを示しています。3つの応答を生成するプロセスでデータをシミュレートすることにより、共変量と応答の相関の原因が異なることにより、不一致の結果を調査しました。これらのデータは、3つの異なる分析方程式によって分析されました。分析方程式がどのように重要なパラメーターを推定し、どのような状況がどのようにバイアスが発生するかを尋ねました。生成と分析方程式の間の不一致は、重要なパラメーターを推定するためにいくつかの扱いにくい問題をもたらしました。最も広く誤った推定されたパラメーターは、応答の被験者間の差異でした。すべての方程式によって生成されたすべてのパラメーターを推定する際に、単一の分析方程式が堅牢であることがわかりました。重要なことに、応答生成方程式と分析方程式が数学的に一致した場合でも、共変量の範囲全体でサンプリングすると、いくつかのパラメーターのバイアスが発生しました。私たちの結果は、データの収集と分析方法に一般的な意味を持っています。また、データの統計分析からの結論は、私たちが測定する属性を生成するプロセスに対して、仮説を条件とすることを条件としていることを私たちに思い出させます。基礎となる生物学的プロセスに関する不確実性に直面して、実際のデータ分析のための戦略について説明します。

Animal ecologists often collect hierarchically structured data and analyse these with linear mixed-effects models. Specific complications arise when the effect sizes of covariates vary on multiple levels (e.g. within vs. among subjects). Mean centring of covariates within subjects offers a useful approach in such situations, but is not without problems. A statistical model represents a hypothesis about the underlying biological process. Mean centring within clusters assumes that the lower level responses (e.g. within subjects) depend on the deviation from the subject mean (relative) rather than on the absolute scale of the covariate. This may or may not be biologically realistic. We show that mismatch between the nature of the generating (i.e. biological) process and the form of the statistical analysis produce major conceptual and operational challenges for empiricists. We explored the consequences of mismatches by simulating data with three response-generating processes differing in the source of correlation between a covariate and the response. These data were then analysed by three different analysis equations. We asked how robustly different analysis equations estimate key parameters of interest and under which circumstances biases arise. Mismatches between generating and analytical equations created several intractable problems for estimating key parameters. The most widely misestimated parameter was the among-subject variance in response. We found that no single analysis equation was robust in estimating all parameters generated by all equations. Importantly, even when response-generating and analysis equations matched mathematically, bias in some parameters arose when sampling across the range of the covariate was limited. Our results have general implications for how we collect and analyse data. They also remind us more generally that conclusions from statistical analysis of data are conditional on a hypothesis, sometimes implicit, for the process(es) that generated the attributes we measure. We discuss strategies for real data analysis in face of uncertainty about the underlying biological process.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google