Apports du TAL à la constitution et à l’exploitation d’un corpus scolaire au travers du développement d’un outil d’annotation orthographique

Fiche du document

Date

6 janvier 2018

Discipline
Type de document
Périmètre
Identifiant
Source

Corpus

Relations

Ce document est lié à :
info:eu-repo/semantics/reference/issn/1638-9808

Ce document est lié à :
info:eu-repo/semantics/reference/issn/1765-3126

Organisation

OpenEdition

Licences

All rights reserved , info:eu-repo/semantics/openAccess



Sujets proches Fr

Traitement outillage

Citer ce document

Claire Wolfarth et al., « Apports du TAL à la constitution et à l’exploitation d’un corpus scolaire au travers du développement d’un outil d’annotation orthographique », Corpus, ID : 10.4000/corpus.2796


Métriques


Partage / Export

Résumé Fr En

Le travail présenté dans cet article s’inscrit dans une recherche qui a pour but la constitution d’un corpus scolaire et le développement d’un outil d’aide à son exploitation à partir de l’annotation de phénomènes linguistiques saillants. Nous nous concentrerons ici sur les écrits produits en fin de classe de CP par des scripteurs encore débutants. L’objet de ce travail est d’explorer les possibilités qu’offre le traitement automatique des langues pour appréhender ces écrits particulièrement éloignés de la norme. L’hypothèse est que la connaissance du contexte de production facilite ce processus. Nous mesurons cet apport au travers d’un exemple de traitement, à savoir le développement d’un outil d’aide à l’annotation de certaines erreurs orthographiques. Après une rapide présentation du projet et des caractéristiques du corpus élaboré, l’article propose un exposé détaillé du module d’annotation de ces erreurs. Il en expose la méthode d’identification et de correction au moyen d’une ressource lexicale de formes phonologiques ainsi que le modèle d’annotation élaboré.

Constituting a school corpora with NLP Our study takes part in a project which aims at elaborating a large corpus of school texts and at developing a linguistic tool facilitating its exploitation. In this article, the focus is put on texts written by novice writers: children at the end of the first year of schooling (6-7 year-old). This study explores possibilities given by natural language processing to annotate non-normed school corpora. Our hypothesis is that the knowledge of the context can ease this process. We measure this contribution through an example of processing, the development of a help tool for specific spell checking. First the project and specificities of the corpus are presented; then, the spell errors annotation module is detailed, both the spell checking methods on the basis of a phonological lexical resource and the annotation model.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en