Loading...
PloS one20190101Vol.14issue(12)

ウェブとラボでのスペルパフォーマンス

,
,
,
,
,
文献タイプ:
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

いくつかの辞書Webサイトは、特定の単語に関するセマンティック、同義語、またはスペル情報にアクセスするためにWebで利用できます。9年間、フランスのWeb辞書から入力されたすべての文字シーケンスを体系的に記録しました。合計2億個の正書法の形が取得され、スペルプロセスに関する心理的理論に情報を提供できるスペルエラーの大規模なデータベースを作成することができました。このビッグデータ方法論の信頼性を確認するために、このデータベースから100個の頻繁に誤った単語のサンプルを選択しました。100人のフランスの大学生のグループは、この単語のリストでスペルから規制へのテストを実行する必要がありました。結果は、生成されたスペルの頻度に関する2つのデータセット間の強い相関を示しました(r = 0.82)。スペルエラーの分布は2つのデータベース間で比較的一貫していましたが、正しい応答の割合は有意な違いを明らかにしました。回帰分析により、タスク依存因子の観点から、これらの違いについて考えられる説明を生成することができました。これらの大規模なデータベースの結果を標準的および制御された実験パラダイムの結果と比較することは、このビッグデータ方法論を心理的理論に通知するために適切に使用できる条件を決定する良い方法であると主張します。

いくつかの辞書Webサイトは、特定の単語に関するセマンティック、同義語、またはスペル情報にアクセスするためにWebで利用できます。9年間、フランスのWeb辞書から入力されたすべての文字シーケンスを体系的に記録しました。合計2億個の正書法の形が取得され、スペルプロセスに関する心理的理論に情報を提供できるスペルエラーの大規模なデータベースを作成することができました。このビッグデータ方法論の信頼性を確認するために、このデータベースから100個の頻繁に誤った単語のサンプルを選択しました。100人のフランスの大学生のグループは、この単語のリストでスペルから規制へのテストを実行する必要がありました。結果は、生成されたスペルの頻度に関する2つのデータセット間の強い相関を示しました(r = 0.82)。スペルエラーの分布は2つのデータベース間で比較的一貫していましたが、正しい応答の割合は有意な違いを明らかにしました。回帰分析により、タスク依存因子の観点から、これらの違いについて考えられる説明を生成することができました。これらの大規模なデータベースの結果を標準的および制御された実験パラダイムの結果と比較することは、このビッグデータ方法論を心理的理論に通知するために適切に使用できる条件を決定する良い方法であると主張します。

Several dictionary websites are available on the web to access semantic, synonymous, or spelling information about a given word. During nine years, we systematically recorded all the entered letter sequences from a French web dictionary. A total of 200 million orthographic forms were obtained allowing us to create a large-scale database of spelling errors that could inform psychological theories about spelling processes. To check the reliability of this big data methodology, we selected from this database a sample of 100 frequently misspelled words. A group of 100 French university students had to perform a spelling-to-dictation test on this list of words. The results showed a strong correlation between the two data sets on the frequencies of produced spellings (r = 0.82). Although the distributions of spelling errors were relatively consistent across the two databases, the proportion of correct responses revealed significant differences. Regression analyses allowed us to generate possible explanations for these differences in terms of task-dependent factors. We argue that comparing the results of these large-scale databases with those of standard and controlled experimental paradigms is certainly a good way to determine the conditions under which this big data methodology can be adequately used for informing psychological theories.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google