Loading...
Studies in health technology and informatics20160101Vol.228issue()

グラフデータベース内の標準的な医療用語を使用したバイオバンクデータの半自動注釈

,
,
,
PMID:27577487DOI:
文献タイプ:
  • Journal Article
概要
Abstract

バイオバンクリソースを説明するデータには、非構造化されていないフリーテキスト情報またはコーディング標準が不十分なことがよくあります。(バイオ)孤児院レア疾患のオントロジー(ORDO)やヒト疾患オントロジー(DOID)などの医学的オントロジーは、多数の概念、同義語、およびエンティティ関係の特性を提供します。このような標準の用語は、検証済みのエンティティ関係から包括的なセマンティックな背景知識を追加することにより、入力データの品質と粒度を高めます。さらに、用語の概念間の相互参照は、異なるコーディング標準を使用してデータベース間でのデータ統合を容易にします。標準の用語の使用を奨励するために、私たちの目的は、バイオバンクレジストリ内のフリーテキスト診断入力と関連する概念を特定してリンクすることです。関連する概念は、RDFトリプルストアに対する語彙マッチングおよびSPARQLクエリによって自動的に選択されます。注釈の正しさを確保するために、提案された概念は、レジストリデータベースに入力される前に、医療データ管理の専門家によって確認する必要があります。疾患と表現型を説明する関連する(バイオ)医療用語は、地元のバイオバンクレジストリに関連付けられたグラフデータベースに特定され、保存されました。データ入力中の概念推奨事項医療データの構造化された説明をトリガーし、異種システム間のデータリンクを促進します。

バイオバンクリソースを説明するデータには、非構造化されていないフリーテキスト情報またはコーディング標準が不十分なことがよくあります。(バイオ)孤児院レア疾患のオントロジー(ORDO)やヒト疾患オントロジー(DOID)などの医学的オントロジーは、多数の概念、同義語、およびエンティティ関係の特性を提供します。このような標準の用語は、検証済みのエンティティ関係から包括的なセマンティックな背景知識を追加することにより、入力データの品質と粒度を高めます。さらに、用語の概念間の相互参照は、異なるコーディング標準を使用してデータベース間でのデータ統合を容易にします。標準の用語の使用を奨励するために、私たちの目的は、バイオバンクレジストリ内のフリーテキスト診断入力と関連する概念を特定してリンクすることです。関連する概念は、RDFトリプルストアに対する語彙マッチングおよびSPARQLクエリによって自動的に選択されます。注釈の正しさを確保するために、提案された概念は、レジストリデータベースに入力される前に、医療データ管理の専門家によって確認する必要があります。疾患と表現型を説明する関連する(バイオ)医療用語は、地元のバイオバンクレジストリに関連付けられたグラフデータベースに特定され、保存されました。データ入力中の概念推奨事項医療データの構造化された説明をトリガーし、異種システム間のデータリンクを促進します。

Data describing biobank resources frequently contains unstructured free-text information or insufficient coding standards. (Bio-) medical ontologies like Orphanet Rare Diseases Ontology (ORDO) or the Human Disease Ontology (DOID) provide a high number of concepts, synonyms and entity relationship properties. Such standard terminologies increase quality and granularity of input data by adding comprehensive semantic background knowledge from validated entity relationships. Moreover, cross-references between terminology concepts facilitate data integration across databases using different coding standards. In order to encourage the use of standard terminologies, our aim is to identify and link relevant concepts with free-text diagnosis inputs within a biobank registry. Relevant concepts are selected automatically by lexical matching and SPARQL queries against a RDF triplestore. To ensure correctness of annotations, proposed concepts have to be confirmed by medical data administration experts before they are entered into the registry database. Relevant (bio-) medical terminologies describing diseases and phenotypes were identified and stored in a graph database which was tied to a local biobank registry. Concept recommendations during data input trigger a structured description of medical data and facilitate data linkage between heterogeneous systems.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google