Loading...
Methods of information in medicine2018May01Vol.57issue(3)

平均ハザード比 - 比例ハザードの仮定に違反した場合のイベントエンドポイントまでの良い効果尺度ですか?

,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

背景:多くの臨床試験アプリケーションでは、関心のあるエンドポイントは、イベントまでのエンドポイントに対応しています。この場合、グループの違いは通常、ハザード比で表されます。グループの違いは一般に、ログランクテストによって評価されます。これは、比例ハザードの仮定の下で最適です。ただし、この仮定に違反される多くの状況があります。特に、アプリケーションでは、完全な集団といくつかのサブグループまたは複合時間までのイベントエンドポイントまでの複合があり、いくつかのコンポーネントが考慮されています。通常、比例ハザードの仮定は、調査中のすべてのテスト問題に同時に当てはまりません。代替効果の尺度として、KalbfleischとPrenticeはいわゆる「平均ハザード比」を提案しました。平均ハザード比は、時間の影響を変更するための柔軟な重み付け関数に基づいており、非依存性の危険の場合でも意味のある解釈があります。この好ましい特性にもかかわらず、実際にはほとんど使用されていませんが、標準的なハザード比は、比例ハザードの仮定が真実であるかどうかに関係なく、臨床試験で一般的に報告されています。 目的:1つ目が加重コックス回帰に依存し、2番目が単純なプラグイン推定器に依存する平均ハザード比の対応する推定器とテストを構築するための2つの主要なアプローチが存在します。この作業の目的は、これら2つのアプローチの体系的な比較と、比例的かつ非均一な危険を伴うさまざまな時間換算設定の標準のログランクテストを提供し、適用の長所と短所を説明することです。 方法:モンテカルロシミュレーションに基づいて、実際の臨床試験の例に基づいて、体系的な比較研究を実施します。 結果:我々の結果は、平均ハザード比の特性が基礎となる重み付け関数に依存することを示唆しています。推定器と関連するテストを構築する2つのアプローチは、適切に選択された重みで非常に類似したパフォーマンスを示しています。一般に、平均ハザード比は、非依存性のハザード下での標準のハザード比よりも有効な効果測定を定義し、対応するテストは一般的なログランクテストよりもパワーの利点を提供します。 結論:臨床診療では非依存性のハザードがしばしば満たされ、平均ハザード比テストはしばしば一般的なログランクテストよりも優れているため、このアプローチはアプリケーションでより日常的に使用する必要があります。

背景:多くの臨床試験アプリケーションでは、関心のあるエンドポイントは、イベントまでのエンドポイントに対応しています。この場合、グループの違いは通常、ハザード比で表されます。グループの違いは一般に、ログランクテストによって評価されます。これは、比例ハザードの仮定の下で最適です。ただし、この仮定に違反される多くの状況があります。特に、アプリケーションでは、完全な集団といくつかのサブグループまたは複合時間までのイベントエンドポイントまでの複合があり、いくつかのコンポーネントが考慮されています。通常、比例ハザードの仮定は、調査中のすべてのテスト問題に同時に当てはまりません。代替効果の尺度として、KalbfleischとPrenticeはいわゆる「平均ハザード比」を提案しました。平均ハザード比は、時間の影響を変更するための柔軟な重み付け関数に基づいており、非依存性の危険の場合でも意味のある解釈があります。この好ましい特性にもかかわらず、実際にはほとんど使用されていませんが、標準的なハザード比は、比例ハザードの仮定が真実であるかどうかに関係なく、臨床試験で一般的に報告されています。 目的:1つ目が加重コックス回帰に依存し、2番目が単純なプラグイン推定器に依存する平均ハザード比の対応する推定器とテストを構築するための2つの主要なアプローチが存在します。この作業の目的は、これら2つのアプローチの体系的な比較と、比例的かつ非均一な危険を伴うさまざまな時間換算設定の標準のログランクテストを提供し、適用の長所と短所を説明することです。 方法:モンテカルロシミュレーションに基づいて、実際の臨床試験の例に基づいて、体系的な比較研究を実施します。 結果:我々の結果は、平均ハザード比の特性が基礎となる重み付け関数に依存することを示唆しています。推定器と関連するテストを構築する2つのアプローチは、適切に選択された重みで非常に類似したパフォーマンスを示しています。一般に、平均ハザード比は、非依存性のハザード下での標準のハザード比よりも有効な効果測定を定義し、対応するテストは一般的なログランクテストよりもパワーの利点を提供します。 結論:臨床診療では非依存性のハザードがしばしば満たされ、平均ハザード比テストはしばしば一般的なログランクテストよりも優れているため、このアプローチはアプリケーションでより日常的に使用する必要があります。

BACKGROUND: In many clinical trial applications, the endpoint of interest corresponds to a time-to-event endpoint. In this case, group differences are usually expressed by the hazard ratio. Group differences are commonly assessed by the logrank test, which is optimal under the proportional hazard assumption. However, there are many situations in which this assumption is violated. Especially in applications were a full population and several subgroups or a composite time-to-first-event endpoint and several components are considered, the proportional hazard assumption usually does not simultaneously hold true for all test problems under investigation. As an alternative effect measure, Kalbfleisch and Prentice proposed the so-called 'average hazard ratio'. The average hazard ratio is based on a flexible weighting function to modify the influence of time and has a meaningful interpretation even in the case of non-proportional hazards. Despite this favorable property, it is hardly ever used in practice, whereas the standard hazard ratio is commonly reported in clinical trials regardless of whether the proportional hazard assumption holds true or not. OBJECTIVES: There exist two main approaches to construct corresponding estimators and tests for the average hazard ratio where the first relies on weighted Cox regression and the second on a simple plug-in estimator. The aim of this work is to give a systematic comparison of these two approaches and the standard logrank test for different time-toevent settings with proportional and nonproportional hazards and to illustrate the pros and cons in application. METHODS: We conduct a systematic comparative study based on Monte-Carlo simulations and by a real clinical trial example. RESULTS: Our results suggest that the properties of the average hazard ratio depend on the underlying weighting function. The two approaches to construct estimators and related tests show very similar performance for adequately chosen weights. In general, the average hazard ratio defines a more valid effect measure than the standard hazard ratio under non-proportional hazards and the corresponding tests provide a power advantage over the common logrank test. CONCLUSIONS: As non-proportional hazards are often met in clinical practice and the average hazard ratio tests often outperform the common logrank test, this approach should be used more routinely in applications.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google