9 décembre 2022
Ce document est lié à :
info:eu-repo/semantics/reference/issn/2554-6643
info:eu-repo/semantics/openAccess
François Delafontaine, « Comprendre les erreurs dans l'annotation automatique d'OFROM », CorFlo, ID : 10.58079/n4tl
Le corpus OFROM s'appuie sur l'outil d'annotation automatique DisMo (Christodoulides 2014, 2015, 2018) pour l'étiquetage de ses "mots" en part-of-speech (PoS), c'est-à-dire en catégories morpho-syntaxiques telles que le verbe, le pronom, etc. L'annotation automatique commet des erreurs : on s'attend en général à ce que 5-10% des étiquettes morpho-syntaxiques s'avèrent fausses. Pour le corpus OFROM, il n'y a jamais vraiment eu l'occasion d'évaluer non seulement le taux d'erreurs, mais aussi...