Loading...
PloS one20200101Vol.15issue(8)

一般化されたベイジアンデートのテスト:新しい言語出会い系

,
,
文献タイプ:
  • Historical Article
  • Journal Article
  • Research Support, Non-U.S. Gov't
概要
Abstract

現在の慣行では、ベイジアン語の系統発生の根の根とデートする場合、研究者は、キャリブレーションポイントとして機能するいくつかのノードの根の年齢と日付の分布を含め、事前に情報の一部を事前に提供する必要があります。これが余地を残す潜在的な主観性に加えて、問題は、世界の多くの言語家族にとって、利用可能な内部キャリブレーションポイントがないということです。ここでは、次の質問に対処します。これらの問題を導入することを克服する新しいベイジアンフレームワークと、それがどの程度うまく機能しますか?私たちが提示する新しいフレームワークは、家族固有のプライアーやキャリブレーションポイントが必要ないという意味で一般化されています。さらに、一般的に実践されているベイジアンツリー推論、すなわち手動同種の識別の別の潜在的な主観性の原因を克服する方法を紹介します。代わりに、自動化されたアプローチを適用します。日付は、30の系統発生的に独立したキャリブレーションポイントで、ガンマ回帰モデルをツリーの長さと既知の時間深度に適合させることによって取得されます。このモデルは、116の言語ファミリのルートノードと内部ノードの両方の時間の深さを予測するために使用され、家族やサブグループに合計1,287日の日付を生成します。結果は、個々の言語家族の出版されたベイジアン研究の結果と類似していることがわかります。この方法のパフォーマンスは、自動化された声門認識と、共有認知の割合から時間の深さを導き出すための新しい式であるスワデシュの古典的な方法の更新である自動声門成長学と比較されます。また、自動化された類似性判断プログラム(ASJP)の3番目の出会い系メソッドと比較されます。既知の日付とのエラーと相関の観点から、ASJPは新しい方法よりもうまく機能し、どちらも自動声門成長学よりもうまく機能します。

現在の慣行では、ベイジアン語の系統発生の根の根とデートする場合、研究者は、キャリブレーションポイントとして機能するいくつかのノードの根の年齢と日付の分布を含め、事前に情報の一部を事前に提供する必要があります。これが余地を残す潜在的な主観性に加えて、問題は、世界の多くの言語家族にとって、利用可能な内部キャリブレーションポイントがないということです。ここでは、次の質問に対処します。これらの問題を導入することを克服する新しいベイジアンフレームワークと、それがどの程度うまく機能しますか?私たちが提示する新しいフレームワークは、家族固有のプライアーやキャリブレーションポイントが必要ないという意味で一般化されています。さらに、一般的に実践されているベイジアンツリー推論、すなわち手動同種の識別の別の潜在的な主観性の原因を克服する方法を紹介します。代わりに、自動化されたアプローチを適用します。日付は、30の系統発生的に独立したキャリブレーションポイントで、ガンマ回帰モデルをツリーの長さと既知の時間深度に適合させることによって取得されます。このモデルは、116の言語ファミリのルートノードと内部ノードの両方の時間の深さを予測するために使用され、家族やサブグループに合計1,287日の日付を生成します。結果は、個々の言語家族の出版されたベイジアン研究の結果と類似していることがわかります。この方法のパフォーマンスは、自動化された声門認識と、共有認知の割合から時間の深さを導き出すための新しい式であるスワデシュの古典的な方法の更新である自動声門成長学と比較されます。また、自動化された類似性判断プログラム(ASJP)の3番目の出会い系メソッドと比較されます。既知の日付とのエラーと相関の観点から、ASJPは新しい方法よりもうまく機能し、どちらも自動声門成長学よりもうまく機能します。

In current practice, when dating the root of a Bayesian language phylogeny the researcher is required to supply some of the information beforehand, including a distribution of root ages and dates for some nodes serving as calibration points. In addition to the potential subjectivity that this leaves room for, the problem arises that for many of the language families of the world there are no available internal calibration points. Here we address the following questions: Can a new Bayesian framework which overcomes these problems be introduced and how well does it perform? The new framework that we present is generalized in the sense that no family-specific priors or calibration points are needed. We moreover introduce a way to overcome another potential source of subjectivity in Bayesian tree inference as commonly practiced, namely that of manual cognate identification; instead, we apply an automated approach. Dates are obtained by fitting a Gamma regression model to tree lengths and known time depths for 30 phylogenetically independent calibration points. This model is used to predict the time depths of both the root and the internal nodes for 116 language families, producing a total of 1,287 dates for families and subgroups. It turns out that results are similar to those of published Bayesian studies of individual language families. The performance of the method is compared to automated glottochronology, which is an update of the classical method of Swadesh drawing upon automated cognate recognition and a new formula for deriving a time depth from percentages of shared cognates. It is also compared to a third dating method, that of the Automated Similarity Judgment Program (ASJP). In terms of errors and correlations with known dates, ASJP works better than the new method and both work better than automated glottochronology.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google