Apports du TAL à la constitution et à l’exploitation d’un corpus scolaire au travers du développement d’un outil d’annotation orthographique

Claire Wolfarth et al., « Apports du TAL à la constitution et à l’exploitation d’un corpus scolaire au travers du développement d’un outil d’annotation orthographique », Corpus, ID : 10.4000/corpus.2796

Partage / Export

Résumé Fr En

Le travail présenté dans cet article s’inscrit dans une recherche qui a pour but la constitution d’un corpus scolaire et le développement d’un outil d’aide à son exploitation à partir de l’annotation de phénomènes linguistiques saillants. Nous nous concentrerons ici sur les écrits produits en fin de classe de CP par des scripteurs encore débutants. L’objet de ce travail est d’explorer les possibilités qu’offre le traitement automatique des langues pour appréhender ces écrits particulièrement éloignés de la norme. L’hypothèse est que la connaissance du contexte de production facilite ce processus. Nous mesurons cet apport au travers d’un exemple de traitement, à savoir le développement d’un outil d’aide à l’annotation de certaines erreurs orthographiques. Après une rapide présentation du projet et des caractéristiques du corpus élaboré, l’article propose un exposé détaillé du module d’annotation de ces erreurs. Il en expose la méthode d’identification et de correction au moyen d’une ressource lexicale de formes phonologiques ainsi que le modèle d’annotation élaboré.

Apports du TAL à la constitution et à l’exploitation d’un corpus scolaire au travers du développement d’un outil d’annotation orthographique

Fiche du document

Mots-clés Fr En

Sujets proches Fr

Citer ce document

Métriques

Partage / Export

Résumé Fr En

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en