Loading...
PloS one20190101Vol.14issue(10)

科学者とデータアーキテクトが協力して、内耳電気生理学データ収集をキュレートしてアーカイブする

,
,
文献タイプ:
  • Journal Article
  • Research Support, N.I.H., Extramural
概要
Abstract

過去に、科学者は彼らの発見の要約を報告しました。彼らは元のデータコレクションを提供しませんでした。多くの利害関係者(資金提供機関など)は現在、そのようなデータを公開することを要求しています。この任務は、さらなる発見を促進し、研究プロセスにおける廃棄物と赤字を緩和するために採用されています。同時に、データキュレーションに必要なインフラストラクチャ(例:リポジトリ)が進化しています。現在のターゲットは、研究製品を公平にすること(見つけやすく、アクセス可能で、相互運用可能、再利用可能)を実現することであり、その結果、キュレーションされ、人間と機械の両方に互換性があるようにアーカイブされます。しかし、ほとんどの科学者はデータキュレーションのトレーニングをほとんど持っていません。具体的には、それらの作成やサブフィールドとは別のコンテキストでの発見可能性、集約、および広範な再利用を促進するレベルでデータコレクションに注釈を付ける能力が整っていません。これらの赤字を回避するために、データアーキテクトは科学者と協力してデータを変換およびキュレートすることができます。この論文のデータ収集の例は、哺乳類のco牛から分離された外毛細胞の電気特性について説明しています。データは、階層データ形式バージョン5(HDF5)形式で使用されるメタデータとネストされたデータアーキテクチャを提供するためにミラーリングされた生物医学調査のオントロジーのバリアントで表されます。各デジタル標本は、ツリー構成(コンピューターのディレクトリなど)に表示され、オントロジークラスに基づいた6つの主要なブランチで構成されています。データ収集、スクリプト、および存在論的フクロウファイル(OBIベースの内耳電気生理学(OBI_IEE))は、3つのリポジトリに堆積します。公共の使用のためにこのようなデータ収集を作成するための障害、および効果的な実装に必要なツールとプロセスについて説明します。この作品は、私たちの公開されたコレクションのキュレーションに小規模なコラボレーションが与える影響を示しており、データがまばらで、スループットが低く、発見には動物の犠牲が必要なフィールドにとって特に顕著です。

過去に、科学者は彼らの発見の要約を報告しました。彼らは元のデータコレクションを提供しませんでした。多くの利害関係者(資金提供機関など)は現在、そのようなデータを公開することを要求しています。この任務は、さらなる発見を促進し、研究プロセスにおける廃棄物と赤字を緩和するために採用されています。同時に、データキュレーションに必要なインフラストラクチャ(例:リポジトリ)が進化しています。現在のターゲットは、研究製品を公平にすること(見つけやすく、アクセス可能で、相互運用可能、再利用可能)を実現することであり、その結果、キュレーションされ、人間と機械の両方に互換性があるようにアーカイブされます。しかし、ほとんどの科学者はデータキュレーションのトレーニングをほとんど持っていません。具体的には、それらの作成やサブフィールドとは別のコンテキストでの発見可能性、集約、および広範な再利用を促進するレベルでデータコレクションに注釈を付ける能力が整っていません。これらの赤字を回避するために、データアーキテクトは科学者と協力してデータを変換およびキュレートすることができます。この論文のデータ収集の例は、哺乳類のco牛から分離された外毛細胞の電気特性について説明しています。データは、階層データ形式バージョン5(HDF5)形式で使用されるメタデータとネストされたデータアーキテクチャを提供するためにミラーリングされた生物医学調査のオントロジーのバリアントで表されます。各デジタル標本は、ツリー構成(コンピューターのディレクトリなど)に表示され、オントロジークラスに基づいた6つの主要なブランチで構成されています。データ収集、スクリプト、および存在論的フクロウファイル(OBIベースの内耳電気生理学(OBI_IEE))は、3つのリポジトリに堆積します。公共の使用のためにこのようなデータ収集を作成するための障害、および効果的な実装に必要なツールとプロセスについて説明します。この作品は、私たちの公開されたコレクションのキュレーションに小規模なコラボレーションが与える影響を示しており、データがまばらで、スループットが低く、発見には動物の犠牲が必要なフィールドにとって特に顕著です。

In the past scientists reported summaries of their findings; they did not provide their original data collections. Many stakeholders (e.g., funding agencies) are now requesting that such data be made publicly available. This mandate is being adopted to facilitate further discovery, and to mitigate waste and deficits in the research process. At the same time, the necessary infrastructure for data curation (e.g., repositories) has been evolving. The current target is to make research products FAIR (Findable, Accessible, Interoperable, Reusable), resulting in data that are curated and archived to be both human and machine compatible. However, most scientists have little training in data curation. Specifically, they are ill-equipped to annotate their data collections at a level that facilitates discoverability, aggregation, and broad reuse in a context separate from their creation or sub-field. To circumvent these deficits data architects may collaborate with scientists to transform and curate data. This paper's example of a data collection describes the electrical properties of outer hair cells isolated from the mammalian cochlea. The data is expressed with a variant of The Ontology for Biomedical Investigations (OBI), mirrored to provide the metadata and nested data architecture used within the Hierarchical Data Format version 5 (HDF5) format. Each digital specimen is displayed in a tree configuration (like directories in a computer) and consists of six main branches based on the ontology classes. The data collections, scripts, and ontological OWL file (OBI based Inner Ear Electrophysiology (OBI_IEE)) are deposited in three repositories. We discuss the impediments to producing such data collections for public use, and the tools and processes required for effective implementation. This work illustrates the impact that small collaborations can have on the curation of our publicly-funded collections, and is particularly salient for fields where data is sparse, throughput is low, and sacrifice of animals is required for discovery.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google