Dependency Parsing of Code-Switching Data with Cross-Lingual Feature Representations

Fiche du document

Date

8 janvier 2018

Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess




Citer ce document

Niko Partanen et al., « Dependency Parsing of Code-Switching Data with Cross-Lingual Feature Representations », HAL-SHS : linguistique, ID : 10670/1.5swfsr


Métriques


Partage / Export

Résumé En

This paper describes the test of a dependency parsing method which is based on bidirectional LSTM feature representations and multilingual word embedding, and evaluates the results on mono-and multilingual data. The results are similar in all cases, with a slightly better results achieved using multilingual data. The languages under investigation are Komi-Zyrian and Russian. Examination of the results by relation type shows that some language specific constructions are correctly recognized even when they appear in naturally occurring code-switching data. Tiivistelmä Tutkimus arvioi dependenssianalyysin menetelmää, joka perustuu kaksisuun-taiseen LSTM-piirrerepresentaatioon ja monikieliseen 'word embedding'-malliin, sekä arvioi tuloksia yksi-ja monikielisissä aineistoissa. Tulokset ovat samanta-paisia, mutta hieman korkeampia moni-kuin yksikielisissä aineistoissa. Tutkitut kielet ovat komisyrjääni ja venäjä. Tulosten yksityiskohtaisempi analyysi riippu-vuuksien mukaan osoittaa, että tietyt kielikohtaiset suhteet on tunnistettu oikein jopa niiden esiintyessä luonnollisissa koodinvaihtoa sisältävissä lauseissa. This work is licensed under a Creative Commons Attribution 4.0 International Licence. Licence details:

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en