Vers l’annotation discursive de textes d’élèves

Abstract Fr En

La contribution se propose de mettre en évidence les problèmes épistémologiques et méthodologiques posés par l’annotation discursive de productions écrites d’élèves et les choix techniques qu’implique sa mise en œuvre. Dans un premier temps, l’article montre l’intérêt scientifique de la constitution de « grands » corpus scolaires rassemblant plusieurs centaines de textes d’élèves d’école primaire et de collège de niveaux scolaires différents répondant à une même consigne. L’unicité de la consigne permet de comparer les productions en vue d’élaborer une cartographie des moyens linguistiques choisis par les élèves et de mettre en évidence des indicateurs de progressivité. Dans un second temps, sont présentés les enseignements tirés de l’expérience d’annotation discursive qui a abouti à la création de la ressource ANNODIS, corpus de textes en français écrit standard annoté discursivement. Elle s’interroge sur les adaptations nécessaires pour traiter des textes d’élèves et définit des principes de travail généraux notamment sur le choix de la version de texte à annoter, la définition du modèle d’annotation et les guides d’annotation. Sont ensuite exposés deux chantiers d’annotation portant sur des textes d’élèves de fin d’école primaire en réponse à une consigne mettant en jeu la cohésion textuelle, qui demande d’insérer dans un texte narratif trois phrases comportant des pronoms et des syntagmes nominaux anaphoriques. Les notions sont illustrées par l’analyse de deux textes d’élèves de 5° Primaire. L’annotation des Relations de Discours procède successivement, dans une démarche proche de celle d’Annodis, par segmentation du texte en Unités de Discours Élémentaires, analyse de la cohérence temporelle et annotation des Relations de discours. L’annotation des chaînes de référence dans les textes d’élèves suppose des adaptations plus importantes du guide d’annotation antérieurement élaboré. Les premiers essais permettent ainsi de définir des principes de travail pour l’annotation des textes d’élèves.

Towards a discursive annotation of student texts This paper addresses epistemological and methodological key issues raised in a project of annotating student texts at the discourse-level. The aim of this project is to map the linguistic strategies used by students for managing discourse-level structuring across different stages of written language acquisition. We first present the scientific interest of our method for building a corpus dedicated to the analysis of discourse structures and text cohesion. By asking students to write a text according to an unique instruction which brings discourse-level structuring into play, we are collecting data from primary school to university which will permit contrastive analyses. Secondely, we present the lessons learned from the ANNODIS project which has resulted in the ANNODIS resource, a discourse-level annotated corpus for written French. The discussion focuses on the choices in terms of materials and annotation guidelines must be adopted for the discursive annotation of student texts. Two works in progress are then presented, both consisting in annotating texts from our corpus: firstly, the annotation of discourse units and discourse relations; secondly, the annotation of coreferential chains. The paper ends with a list of recommendations for the discursive annotation of student texts.

From the same authors

On the same subjects

Similar documents

Within the same disciplines