Loading...
Language resources and evaluation20180101Vol.52issue(3)

Verbnetスタイルの分類の横断的翻訳性の調査

,
,
,
,
,
,
,
文献タイプ:
  • Journal Article
概要
Abstract

Verbnet-English-HASが現在利用可能な最も広範なオンライン動詞辞書は、さまざまなNLPタスクのサポートに役立つことが証明されました。ただし、多言語NLPでのその搾取は、そのような分類が少数の言語でのみ利用可能であるという事実によって制限されています。Verbnetの手動開発は主要な事業であるため、研究者は最近、Verbnetクラスを英語から他の言語に翻訳しました。ただし、異なる類型的に多様な言語にわたるこのような翻訳アプローチの適用性と精度について、体系的な調査は行われていません。私たちの研究は、このギャップを埋めることを目的としています。私たちは、英語から他の言語へのVerbnetクラスの翻訳のための体系的な方法を開発します。これは、最初にポリッシュに適用され、その後クロアチア語、マンダリン、日本、イタリア語、フィンランド語に適用されます。ポリッシュに関する我々の結果は、すべてのクラス(英語のメンバーの動詞の96%がポリッシュに成功した)と強力なアノテーター間協定で高い翻訳性を示し、結果として生じる分類の有望な程度の重複を明らかにしています。他の言語の結果も同様に有望です。これは、Verbnetクラスには強い言語間の可能性があり、提案された方法を適用して、異なる言語での自動動詞分類のための金基準を取得できることを示しています。このペーパーでは、注釈のガイドラインと6つの言語固有の動詞分類を利用できます。

Verbnet-English-HASが現在利用可能な最も広範なオンライン動詞辞書は、さまざまなNLPタスクのサポートに役立つことが証明されました。ただし、多言語NLPでのその搾取は、そのような分類が少数の言語でのみ利用可能であるという事実によって制限されています。Verbnetの手動開発は主要な事業であるため、研究者は最近、Verbnetクラスを英語から他の言語に翻訳しました。ただし、異なる類型的に多様な言語にわたるこのような翻訳アプローチの適用性と精度について、体系的な調査は行われていません。私たちの研究は、このギャップを埋めることを目的としています。私たちは、英語から他の言語へのVerbnetクラスの翻訳のための体系的な方法を開発します。これは、最初にポリッシュに適用され、その後クロアチア語、マンダリン、日本、イタリア語、フィンランド語に適用されます。ポリッシュに関する我々の結果は、すべてのクラス(英語のメンバーの動詞の96%がポリッシュに成功した)と強力なアノテーター間協定で高い翻訳性を示し、結果として生じる分類の有望な程度の重複を明らかにしています。他の言語の結果も同様に有望です。これは、Verbnetクラスには強い言語間の可能性があり、提案された方法を適用して、異なる言語での自動動詞分類のための金基準を取得できることを示しています。このペーパーでは、注釈のガイドラインと6つの言語固有の動詞分類を利用できます。

VerbNet-the most extensive online verb lexicon currently available for English-has proved useful in supporting a variety of NLP tasks. However, its exploitation in multilingual NLP has been limited by the fact that such classifications are available for few languages only. Since manual development of VerbNet is a major undertaking, researchers have recently translated VerbNet classes from English to other languages. However, no systematic investigation has been conducted into the applicability and accuracy of such a translation approach across different, typologically diverse languages. Our study is aimed at filling this gap. We develop a systematic method for translation of VerbNet classes from English to other languages which we first apply to Polish and subsequently to Croatian, Mandarin, Japanese, Italian, and Finnish. Our results on Polish demonstrate high translatability with all the classes (96% of English member verbs successfully translated into Polish) and strong inter-annotator agreement, revealing a promising degree of overlap in the resultant classifications. The results on other languages are equally promising. This demonstrates that VerbNet classes have strong cross-lingual potential and the proposed method could be applied to obtain gold standards for automatic verb classification in different languages. We make our annotation guidelines and the six language-specific verb classifications available with this paper.

医師のための臨床サポートサービス

ヒポクラ x マイナビのご紹介

無料会員登録していただくと、さらに便利で効率的な検索が可能になります。

Translated by Google