2021
Cairn
Claude Ponton et al., « SCOLINTER : un corpus trilingue. L’exemple de la segmentation en mots », Langue française, ID : 10670/1.vad3du
Cet article décrit la conception d’un corpus d’écrits scolaires longitudinal et trilingue (français, espagnol, italien). L’objectif est d’établir une comparaison de l’évolution des compétences en littéracie entre ces trois langues à l’école primaire. Pour le moment, seul le CP (grade 1) a été entièrement traité mais les mêmes élèves seront suivis jusqu’au CM2 (grade 5). L’exploitation de ce corpus propose une approche reposant sur des comparaisons entre la version des textes produits par les élèves et une version dite ‹normalisée›. Cette approche permet d’assister la description linguistique des réussites et des difficultés dans l’apprentissage de l’écrit. En particulier, l’article s’intéressera à la segmentation entre les mots, en mettant en évidence à la fois la fréquence du phénomène et les catégories de mots dans lesquelles il se produit. L’analyse comparative révèle la présence de caractéristiques similaires dans le corpus trilingue.