著名医師による解説が無料で読めます
すると翻訳の精度が向上します
理論的根拠、目的、および目的:不均一性は、収集された研究を組み合わせることの適切性を意味し、合成された結果の信頼性に影響を与えるため、メタ分析の重要な問題です。Qテストは、不均一性を評価する従来の方法です。ただし、臨床医に直感的な解釈がなく、統計力が低いことが多いため、多くのメタアナリストは、i2統計などのいくつかの測定値を使用して不均一性の程度を定量化するために変化します。この記事は、不均一性を評価し、そのパフォーマンスを比較するための利用可能なツールの概要を提供することを目的としています。 方法:4つの不均一性測定値(i2、r ̂ i、r̂m、およびr ̂ b)をレビューし、それらをq統計のようなテスト統計としてどのように扱うことができるかを示しました。これらの測定値は、3つの実際の例によって駆動されるシミュレーションに基づいて統計的能力に関して比較されました。4つの測定値間のペアワイズ一致も、コーエンのκ係数を使用して評価されました。 結果:一般的に、R ̂はQテストよりもわずかに強力でしたが、そのタイプIエラー率はわずかに膨らんでいる可能性があります。i2のパワーはQのパワーにかなり近かった。r ̂ mおよびr̂b統計は、場合によっては低い力を持っている可能性がある。i2、r ̂ i、およびqの力の違いはしばしば小さかったため、qテストがそうしなかった場合、i2とr ̂ iがi2とr ̂ iが有意な不均一性をもたらすとは思わないかもしれません。さらに、I2とR ̂は、シミュレートされたメタ分析に基づいてかなり良い一致をしましたが、異質性測定の他のすべてのペアは一般に不十分でした。 結論:不均一性の測定には、i2およびr ̂ I統計が推奨されます。メタアナリストは、単にその大きさに基づいて不均一性の重要性を決定するのではなく、臨床的観点から直感的な解釈を持つ記述統計として不均一性測定を使用する必要があります。
理論的根拠、目的、および目的:不均一性は、収集された研究を組み合わせることの適切性を意味し、合成された結果の信頼性に影響を与えるため、メタ分析の重要な問題です。Qテストは、不均一性を評価する従来の方法です。ただし、臨床医に直感的な解釈がなく、統計力が低いことが多いため、多くのメタアナリストは、i2統計などのいくつかの測定値を使用して不均一性の程度を定量化するために変化します。この記事は、不均一性を評価し、そのパフォーマンスを比較するための利用可能なツールの概要を提供することを目的としています。 方法:4つの不均一性測定値(i2、r ̂ i、r̂m、およびr ̂ b)をレビューし、それらをq統計のようなテスト統計としてどのように扱うことができるかを示しました。これらの測定値は、3つの実際の例によって駆動されるシミュレーションに基づいて統計的能力に関して比較されました。4つの測定値間のペアワイズ一致も、コーエンのκ係数を使用して評価されました。 結果:一般的に、R ̂はQテストよりもわずかに強力でしたが、そのタイプIエラー率はわずかに膨らんでいる可能性があります。i2のパワーはQのパワーにかなり近かった。r ̂ mおよびr̂b統計は、場合によっては低い力を持っている可能性がある。i2、r ̂ i、およびqの力の違いはしばしば小さかったため、qテストがそうしなかった場合、i2とr ̂ iがi2とr ̂ iが有意な不均一性をもたらすとは思わないかもしれません。さらに、I2とR ̂は、シミュレートされたメタ分析に基づいてかなり良い一致をしましたが、異質性測定の他のすべてのペアは一般に不十分でした。 結論:不均一性の測定には、i2およびr ̂ I統計が推奨されます。メタアナリストは、単にその大きさに基づいて不均一性の重要性を決定するのではなく、臨床的観点から直感的な解釈を持つ記述統計として不均一性測定を使用する必要があります。
RATIONALE, AIMS, AND OBJECTIVES: Heterogeneity is a critical issue in meta-analysis, because it implies the appropriateness of combining the collected studies and impacts the reliability of the synthesized results. The Q test is a traditional method to assess heterogeneity; however, because it does not have an intuitive interpretation for clinicians and often has low statistical power, many meta-analysts alter to use some measures, such as the I2 statistic, to quantify the extent of heterogeneity. This article aims at providing a summary of available tools to assess heterogeneity and comparing their performance. METHODS: We reviewed four heterogeneity measures (I2 , R ̂ I , R ̂ M , and R ̂ b ) and illustrated how they could be treated as test statistics like the Q statistic. These measures were compared with respect to statistical power based on simulations driven by three real-data examples. The pairwise agreement among the four measures was also evaluated using Cohen's κ coefficient. RESULTS: Generally, R ̂ I was slightly more powerful than the Q test, while its type I error rate might be slightly inflated. The power of I2 was fairly close to that of Q. The R ̂ M and R ̂ b statistics might have low powers in some cases. Because the differences between the powers of I2 , R ̂ I , and Q were often tiny, meta-analysts might not expect I2 and R ̂ I to yield significant heterogeneity if the Q test failed to do so. In addition, I2 and R ̂ I had fairly good agreement based on the simulated meta-analyses, but all other pairs of heterogeneity measures generally had poor agreement. CONCLUSION: The I2 and R ̂ I statistics are recommended for measuring heterogeneity. Meta-analysts should use the heterogeneity measures as descriptive statistics which have intuitive interpretations from the clinical perspective, instead of determining the significance of heterogeneity simply based on their magnitudes.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。