著名医師による解説が無料で読めます
すると翻訳の精度が向上します
テキストレポートから構造化されたデータの抽出は、研究とケアのための医療データ倉庫を構築するための重要なサブタスクです。多くの医学的およびほとんどの放射線レポートは、発見の存在または不在を説明する名詞句の連結を伴う電信スタイルで書かれています。したがって、レキシコ - シナタクタクタルアプローチは有望であり、主要な用語とその関係は、事前定義された標準用語(オントロジー)に認識され、マッピングされます。用語マッチングのための2相アルゴリズムを提案します。最初のパスでは、認識のためのローカル用語は、放射線レポートで使用される用語にできるだけ近いことです。2番目のパスでは、ローカル用語は標準用語にマッピングされます。この論文では、局所用語の半自動生成の最初のステップのアルゴリズムについて報告し、ヴュルツブルク大学病院からの胸部X線検査の放射線学レポートでアルゴリズムを評価します。ドメインの専門家としての放射線科医の約20時間の仕事、会議のために10時間の努力により、約250の属性とさまざまなバリューパターンを備えたローカル用語が構築されました。ランダムに選択された100のレポートでの評価では、情報抽出のために約95%のF1スコアが達成されました。
テキストレポートから構造化されたデータの抽出は、研究とケアのための医療データ倉庫を構築するための重要なサブタスクです。多くの医学的およびほとんどの放射線レポートは、発見の存在または不在を説明する名詞句の連結を伴う電信スタイルで書かれています。したがって、レキシコ - シナタクタクタルアプローチは有望であり、主要な用語とその関係は、事前定義された標準用語(オントロジー)に認識され、マッピングされます。用語マッチングのための2相アルゴリズムを提案します。最初のパスでは、認識のためのローカル用語は、放射線レポートで使用される用語にできるだけ近いことです。2番目のパスでは、ローカル用語は標準用語にマッピングされます。この論文では、局所用語の半自動生成の最初のステップのアルゴリズムについて報告し、ヴュルツブルク大学病院からの胸部X線検査の放射線学レポートでアルゴリズムを評価します。ドメインの専門家としての放射線科医の約20時間の仕事、会議のために10時間の努力により、約250の属性とさまざまなバリューパターンを備えたローカル用語が構築されました。ランダムに選択された100のレポートでの評価では、情報抽出のために約95%のF1スコアが達成されました。
Extraction of structured data from textual reports is an important subtask for building medical data warehouses for research and care. Many medical and most radiology reports are written in a telegraphic style with a concatenation of noun phrases describing the presence or absence of findings. Therefore a lexico-syntactical approach is promising, where key terms and their relations are recognized and mapped on a predefined standard terminology (ontology). We propose a two-phase algorithm for terminology matching: In the first pass, a local terminology for recognition is derived as close as possible to the terms used in the radiology reports. In the second pass, the local terminology is mapped to a standard terminology. In this paper, we report on an algorithm for the first step of semi-automatic generation of the local terminology and evaluate the algorithm with radiology reports of chest X-ray examinations from Würzburg university hospital. With an effort of about 20 hours work of a radiologist as domain expert and 10 hours for meetings, a local terminology with about 250 attributes and various value patterns was built. In an evaluation with 100 randomly chosen reports it achieved an F1-Score of about 95% for information extraction.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。