Loading...
Cognition2017Jul01Vol.164issue()

ブートストラップ言語習得

,
,
,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

セマンティックブートストラップ仮説は、子どもたちがこれらの概念を表現するために使用される単語や構文構造に関連する構成の表現との構造的な表現と対になった言語の文章との露出を通じて母国語を獲得することを提案しています。子供の仕事は、文学的な文法と語彙を学ぶことです(おそらく文脈的に曖昧で、おそらくやや騒々しい)文のペアとその意味表現(論理形式)に基づいています。これらの仮定から、計算解析と無制限のテキストの解釈からの技術に基づいて、子どもの意味的にブートストラップされた第一言語習得のベイジアン確率的説明を作成します。私たちの学習者は共同で(a)単語学習をモデル化します:言語の指定された意味の意味と語彙的単語(またはフレーズ)のコンポーネント間のマッピング、および(b)構文学習:普遍的な建設のないSyntacticによる文字障害要素の検出ルール。インクリメンタル学習アルゴリズムを使用して、モデルを、文脈的にもっともらしいが無関係なディストラクタを含む、モデルを構文的に複雑な子供向けの実際の発話と(擬似)論理形式のデータセットに適用します。Childes Corpusの前夜セクションを入力として使用すると、このモデルは発達文献からいくつかの十分に文書化された現象をシミュレートします。特に、モデルは構文的なブートストラップ効果(以前に学んだ構造が新しい単語の学習を促進する)、明示的なパラメーターの設定なしでの突然の学習のジャンプ、単語学習の加速(「語彙の噴出」)、最初のバイアスを示します。動詞上の名詞の学習、そして言葉とその意味のワンショット学習。したがって、学習者は、構造化された表現よりも統計的学習が、これらの一見異なる現象の統一されたアカウントをどのように提供できるかを示しています。

セマンティックブートストラップ仮説は、子どもたちがこれらの概念を表現するために使用される単語や構文構造に関連する構成の表現との構造的な表現と対になった言語の文章との露出を通じて母国語を獲得することを提案しています。子供の仕事は、文学的な文法と語彙を学ぶことです(おそらく文脈的に曖昧で、おそらくやや騒々しい)文のペアとその意味表現(論理形式)に基づいています。これらの仮定から、計算解析と無制限のテキストの解釈からの技術に基づいて、子どもの意味的にブートストラップされた第一言語習得のベイジアン確率的説明を作成します。私たちの学習者は共同で(a)単語学習をモデル化します:言語の指定された意味の意味と語彙的単語(またはフレーズ)のコンポーネント間のマッピング、および(b)構文学習:普遍的な建設のないSyntacticによる文字障害要素の検出ルール。インクリメンタル学習アルゴリズムを使用して、モデルを、文脈的にもっともらしいが無関係なディストラクタを含む、モデルを構文的に複雑な子供向けの実際の発話と(擬似)論理形式のデータセットに適用します。Childes Corpusの前夜セクションを入力として使用すると、このモデルは発達文献からいくつかの十分に文書化された現象をシミュレートします。特に、モデルは構文的なブートストラップ効果(以前に学んだ構造が新しい単語の学習を促進する)、明示的なパラメーターの設定なしでの突然の学習のジャンプ、単語学習の加速(「語彙の噴出」)、最初のバイアスを示します。動詞上の名詞の学習、そして言葉とその意味のワンショット学習。したがって、学習者は、構造化された表現よりも統計的学習が、これらの一見異なる現象の統一されたアカウントをどのように提供できるかを示しています。

The semantic bootstrapping hypothesis proposes that children acquire their native language through exposure to sentences of the language paired with structured representations of their meaning, whose component substructures can be associated with words and syntactic structures used to express these concepts. The child's task is then to learn a language-specific grammar and lexicon based on (probably contextually ambiguous, possibly somewhat noisy) pairs of sentences and their meaning representations (logical forms). Starting from these assumptions, we develop a Bayesian probabilistic account of semantically bootstrapped first-language acquisition in the child, based on techniques from computational parsing and interpretation of unrestricted text. Our learner jointly models (a) word learning: the mapping between components of the given sentential meaning and lexical words (or phrases) of the language, and (b) syntax learning: the projection of lexical elements onto sentences by universal construction-free syntactic rules. Using an incremental learning algorithm, we apply the model to a dataset of real syntactically complex child-directed utterances and (pseudo) logical forms, the latter including contextually plausible but irrelevant distractors. Taking the Eve section of the CHILDES corpus as input, the model simulates several well-documented phenomena from the developmental literature. In particular, the model exhibits syntactic bootstrapping effects (in which previously learned constructions facilitate the learning of novel words), sudden jumps in learning without explicit parameter setting, acceleration of word-learning (the "vocabulary spurt"), an initial bias favoring the learning of nouns over verbs, and one-shot learning of words and their meanings. The learner thus demonstrates how statistical learning over structured representations can provide a unified account for these seemingly disparate phenomena.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google