Loading...
Injury prevention : journal of the International Society for Child and Adolescent Injury Prevention2011Dec01Vol.17issue(6)

ファジーと素朴なベイジアン戦略を組み合わせて、イベントコードを怪我の物語に割り当てることができます

,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

背景:ベイジアンの方法は、大規模な管理データセットからの怪我の物語を原因グループに分類するための約束を示しています。この研究では、2つのベイジアンモデル(ファジーとナイーブ)を使用して、物語を分類するか、手動レビューのためにそれを選択するために使用された複合アプローチを調べました。 方法:2002年1月から2004年12月の間に労働者の補償保険プロバイダーに提出された請求から怪我の物語が抽出されました。物語はトレーニングセット(n = 11,000)と予測セット(n = 3,000)に分離されました。専門家のコーダーは、各物語に2桁の労働統計統計統計統計および病気分類イベントコードを割り当てました。ファジーおよびナイーブなベイジアンモデルは、トレーニングセットで手動で分類されたケースを使用して開発されました。2つの半自動マシンコーディング戦略が評価されました。最初の戦略は、ファジーモデルとナイーブモデルが分類に関して同意しなかった場合、手動レビューのためにケースを割り当てました。2番目の戦略では、予測強度を使用して50%のコンピューターコーディングと50%の手動コーディングに到達するために、同意データセットから手動レビューのために追加のケースを選択しました。 結果:合意のみがフィルタリング戦略として使用された場合、大半はコンピューター(n = 1,928、64%)によってコード化されました。全体的な組み合わせ(Human Plus Computer)感度は0.90であり、18の2桁のイベントカテゴリのうち11で正の予測値(PPV)は> 0.90でした。2番目の戦略を実装すると、18のカテゴリのうち17で0.95およびPPV> 0.90の全体的な感度で結果が改善されました。 結論:ナイーブファジーなベイジアンアプローチを組み合わせることで、いくつかの物語を高い精度で分類し、手動レビューに最も有益な他の物語を特定し、人間のコーダーの負担を軽減することができます。

背景:ベイジアンの方法は、大規模な管理データセットからの怪我の物語を原因グループに分類するための約束を示しています。この研究では、2つのベイジアンモデル(ファジーとナイーブ)を使用して、物語を分類するか、手動レビューのためにそれを選択するために使用された複合アプローチを調べました。 方法:2002年1月から2004年12月の間に労働者の補償保険プロバイダーに提出された請求から怪我の物語が抽出されました。物語はトレーニングセット(n = 11,000)と予測セット(n = 3,000)に分離されました。専門家のコーダーは、各物語に2桁の労働統計統計統計統計および病気分類イベントコードを割り当てました。ファジーおよびナイーブなベイジアンモデルは、トレーニングセットで手動で分類されたケースを使用して開発されました。2つの半自動マシンコーディング戦略が評価されました。最初の戦略は、ファジーモデルとナイーブモデルが分類に関して同意しなかった場合、手動レビューのためにケースを割り当てました。2番目の戦略では、予測強度を使用して50%のコンピューターコーディングと50%の手動コーディングに到達するために、同意データセットから手動レビューのために追加のケースを選択しました。 結果:合意のみがフィルタリング戦略として使用された場合、大半はコンピューター(n = 1,928、64%)によってコード化されました。全体的な組み合わせ(Human Plus Computer)感度は0.90であり、18の2桁のイベントカテゴリのうち11で正の予測値(PPV)は> 0.90でした。2番目の戦略を実装すると、18のカテゴリのうち17で0.95およびPPV> 0.90の全体的な感度で結果が改善されました。 結論:ナイーブファジーなベイジアンアプローチを組み合わせることで、いくつかの物語を高い精度で分類し、手動レビューに最も有益な他の物語を特定し、人間のコーダーの負担を軽減することができます。

BACKGROUND: Bayesian methods show promise for classifying injury narratives from large administrative datasets into cause groups. This study examined a combined approach where two Bayesian models (Fuzzy and Naïve) were used to either classify a narrative or select it for manual review. METHODS: Injury narratives were extracted from claims filed with a worker's compensation insurance provider between January 2002 and December 2004. Narratives were separated into a training set (n=11,000) and prediction set (n=3,000). Expert coders assigned two-digit Bureau of Labor Statistics Occupational Injury and Illness Classification event codes to each narrative. Fuzzy and Naïve Bayesian models were developed using manually classified cases in the training set. Two semi-automatic machine coding strategies were evaluated. The first strategy assigned cases for manual review if the Fuzzy and Naïve models disagreed on the classification. The second strategy selected additional cases for manual review from the Agree dataset using prediction strength to reach a level of 50% computer coding and 50% manual coding. RESULTS: When agreement alone was used as the filtering strategy, the majority were coded by the computer (n=1,928, 64%) leaving 36% for manual review. The overall combined (human plus computer) sensitivity was 0.90 and positive predictive value (PPV) was >0.90 for 11 of 18 2-digit event categories. Implementing the 2nd strategy improved results with an overall sensitivity of 0.95 and PPV >0.90 for 17 of 18 categories. CONCLUSIONS: A combined Naïve-Fuzzy Bayesian approach can classify some narratives with high accuracy and identify others most beneficial for manual review, reducing the burden on human coders.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google