Loading...
PloS one20090101Vol.4issue(3)

クリックストリームデータは、科学の高解像度マップを生成します

,
,
,
,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
  • Validation Study
概要
Abstract

背景:科学の複雑な地図が引用データから作成され、科学的活動の構造を視覚化しています。ただし、ほとんどの科学的出版物は現在オンラインでアクセスされています。学術Webポータルは、既存のすべての引用の組み合わせの数を超えるスケールで詳細なログデータを記録します。このようなログデータは、公開時にすぐに記録され、さまざまなドメインでさまざまなユーザーが発行するユーザー要求のシーケンス(クリックストリーム)を追跡します。引用データに対するログデータセットのこれらの利点を考えると、高解像度の現在の科学マップを生成できるかどうかを調査します。 方法論:2007年と2008年の間に、最も重要な出版社、アグリゲーター、および機関のコンソーシアムの学術Webポータルによって記録された約10億人のユーザーインタラクションを収集しました。結果の参照データセットは、2006年の学術Webポータルの世界的な使用の重要な部分をカバーし、人文科学、社会科学、および自然科学のバランスの取れた報道を提供します。ジャーナルクリックストリームモデル、つまり1次マルコフチェーンが、ログ内のユーザーインタラクションのシーケンスから抽出されました。クリックストリームモデルは、ゲッティ研究所の建築とアートシソーラスと比較することにより検証されました。結果のモデルは、さまざまな科学的領域間の関係を概説し、社会科学と人文科学の自然科学とのつながりを明確にするジャーナルネットワークとして視覚化されました。 結論:大規模なクリックストリームデータに起因する科学の地図は、科学的活動の詳細で現代的な見解を提供し、引用データによく見られる社会科学と人文科学の過小評価を修正します。

背景:科学の複雑な地図が引用データから作成され、科学的活動の構造を視覚化しています。ただし、ほとんどの科学的出版物は現在オンラインでアクセスされています。学術Webポータルは、既存のすべての引用の組み合わせの数を超えるスケールで詳細なログデータを記録します。このようなログデータは、公開時にすぐに記録され、さまざまなドメインでさまざまなユーザーが発行するユーザー要求のシーケンス(クリックストリーム)を追跡します。引用データに対するログデータセットのこれらの利点を考えると、高解像度の現在の科学マップを生成できるかどうかを調査します。 方法論:2007年と2008年の間に、最も重要な出版社、アグリゲーター、および機関のコンソーシアムの学術Webポータルによって記録された約10億人のユーザーインタラクションを収集しました。結果の参照データセットは、2006年の学術Webポータルの世界的な使用の重要な部分をカバーし、人文科学、社会科学、および自然科学のバランスの取れた報道を提供します。ジャーナルクリックストリームモデル、つまり1次マルコフチェーンが、ログ内のユーザーインタラクションのシーケンスから抽出されました。クリックストリームモデルは、ゲッティ研究所の建築とアートシソーラスと比較することにより検証されました。結果のモデルは、さまざまな科学的領域間の関係を概説し、社会科学と人文科学の自然科学とのつながりを明確にするジャーナルネットワークとして視覚化されました。 結論:大規模なクリックストリームデータに起因する科学の地図は、科学的活動の詳細で現代的な見解を提供し、引用データによく見られる社会科学と人文科学の過小評価を修正します。

BACKGROUND: Intricate maps of science have been created from citation data to visualize the structure of scientific activity. However, most scientific publications are now accessed online. Scholarly web portals record detailed log data at a scale that exceeds the number of all existing citations combined. Such log data is recorded immediately upon publication and keeps track of the sequences of user requests (clickstreams) that are issued by a variety of users across many different domains. Given these advantages of log datasets over citation data, we investigate whether they can produce high-resolution, more current maps of science. METHODOLOGY: Over the course of 2007 and 2008, we collected nearly 1 billion user interactions recorded by the scholarly web portals of some of the most significant publishers, aggregators and institutional consortia. The resulting reference data set covers a significant part of world-wide use of scholarly web portals in 2006, and provides a balanced coverage of the humanities, social sciences, and natural sciences. A journal clickstream model, i.e. a first-order Markov chain, was extracted from the sequences of user interactions in the logs. The clickstream model was validated by comparing it to the Getty Research Institute's Architecture and Art Thesaurus. The resulting model was visualized as a journal network that outlines the relationships between various scientific domains and clarifies the connection of the social sciences and humanities to the natural sciences. CONCLUSIONS: Maps of science resulting from large-scale clickstream data provide a detailed, contemporary view of scientific activity and correct the underrepresentation of the social sciences and humanities that is commonly found in citation data.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google