Comprendre les erreurs dans l'annotation automatique d'OFROM

Fiche du document

Date

9 décembre 2022

Discipline
Types de document
Périmètre
Identifiant
Source

CorFlo

Relations

Ce document est lié à :
info:eu-repo/semantics/reference/issn/2554-6643

Organisation

OpenEdition

Licence

info:eu-repo/semantics/openAccess



Citer ce document

François Delafontaine, « Comprendre les erreurs dans l'annotation automatique d'OFROM », CorFlo, ID : 10.58079/n4tl


Métriques


Partage / Export

Résumé 0

Le corpus OFROM s'appuie sur l'outil d'annotation automatique DisMo (Christodoulides 2014, 2015, 2018) pour l'étiquetage de ses "mots" en part-of-speech (PoS), c'est-à-dire en catégories morpho-syntaxiques telles que le verbe, le pronom, etc. L'annotation automatique commet des erreurs : on s'attend en général à ce que 5-10% des étiquettes morpho-syntaxiques s'avèrent fausses. Pour le corpus OFROM, il n'y a jamais vraiment eu l'occasion d'évaluer non seulement le taux d'erreurs, mais aussi...

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en