SCOLINTER : un corpus trilingue. L’exemple de la segmentation en mots

Fiche du document

Date

2021

Discipline
Type de document
Périmètre
Langue
Identifiant
Collection

Cairn.info

Organisation

Cairn

Licence

Cairn




Citer ce document

Claude Ponton et al., « SCOLINTER : un corpus trilingue. L’exemple de la segmentation en mots », Langue française, ID : 10670/1.vad3du


Métriques


Partage / Export

Résumé Fr En

Cet article décrit la conception d’un corpus d’écrits scolaires longitudinal et trilingue (français, espagnol, italien). L’objectif est d’établir une comparaison de l’évolution des compétences en littéracie entre ces trois langues à l’école primaire. Pour le moment, seul le CP (grade 1) a été entièrement traité mais les mêmes élèves seront suivis jusqu’au CM2 (grade 5). L’exploitation de ce corpus propose une approche reposant sur des comparaisons entre la version des textes produits par les élèves et une version dite ‹normalisée›. Cette approche permet d’assister la description linguistique des réussites et des difficultés dans l’apprentissage de l’écrit. En particulier, l’article s’intéressera à la segmentation entre les mots, en mettant en évidence à la fois la fréquence du phénomène et les catégories de mots dans lesquelles il se produit. L’analyse comparative révèle la présence de caractéristiques similaires dans le corpus trilingue.

This article presents a longitudinal, trilingual (French, Spanish and Italian) school writing corpus. Its aim is to compare the evolution of literacy skills between these three languages in primary school. Actually, only CP (grade 1) has been entirely treated but the same pupils will be followed up to CM2 (grade 5). The exploitation of this corpus proposes a tool-based approach based on comparisons between the version of the texts produced by the pupils and a so-called ‹standardised› version. This approach makes it possible to produce a linguistic description of the achievements and problems that pupils face in their texts. In particular, this article focus on segmentation between words, highlighting both the frequency of the phenomenon and the categories of words in which it occurs. The comparative analysis reveals the presence of similar characteristics in the trilingual corpus.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en