Corpus and Models for Lemmatisation and POS-tagging of Old French

Fiche du document

Date

2021

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licences

http://creativecommons.org/licenses/by/ , info:eu-repo/semantics/OpenAccess




Citer ce document

Jean-Baptiste Camps et al., « Corpus and Models for Lemmatisation and POS-tagging of Old French », HAL-SHS : linguistique, ID : 10670/1.s45jju


Métriques


Partage / Export

Résumé En Fr

Old French is a typical example of an under-resourced historic languages, that furtherly displays an important amount of linguistic variation. In this paper, we present the current results of a long going project (2015-.. .) and describe how we broached the difficult question of providing lemmatisation and POS models for Old French with the help of neural taggers and the progressive constitution of dedicated corpora.

L'ancien français est un exemple caractéristique d'une langue historique peu pourvue en ressources, qui présente en outre une importante variation linguistique. Dans cet article, nous présentons les résultats actuels d'un projet de longue haleine (2015-...) et décrivons comment nous avons abordé la difficile question de la lemmatisation et des modèles d'annotation morphosyntaxique pour l'ancien français à l'aide d'étiqueteurs neuronaux et de la constitution progressive de corpus dédiés.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en