2021
http://creativecommons.org/licenses/by/ , info:eu-repo/semantics/OpenAccess
Jean-Baptiste Camps et al., « Corpus and Models for Lemmatisation and POS-tagging of Old French », HAL-SHS : linguistique, ID : 10670/1.s45jju
L'ancien français est un exemple caractéristique d'une langue historique peu pourvue en ressources, qui présente en outre une importante variation linguistique. Dans cet article, nous présentons les résultats actuels d'un projet de longue haleine (2015-...) et décrivons comment nous avons abordé la difficile question de la lemmatisation et des modèles d'annotation morphosyntaxique pour l'ancien français à l'aide d'étiqueteurs neuronaux et de la constitution progressive de corpus dédiés.