21 juin 2023
free_for_non_commercial_use , Libre sans utilisation commerciale , Free for non commercial use , licence Creative Commons Attribution - Pas du2019Utilisation Commerciale - Pas de Modification 3.0 non transposé
Claude Ponton et al., « E-CALM écriture scolaire », ORTOLANG
Corpus de transcriptions d’écrits d’élèves et d’étudiants (du CP au lycée) encodé selon la TEI-P5 incluant l'annotation des traces d'écritures (ratures, insertions, etc.). Ce corpus a été constitué dans le cadre du projet ANR E-CALM (http://e-calm.huma-num.fr/) coordonné par Claire Doquet. Claude Ponton, Claire Doquet, Serge Fleury, Lydia Mai Ho-Dac (2022). E-CALM [Corpus]. ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr, v2.1, https://hdl.handle.net/11403/e-calm/v2.1.Plus d'information dans l'article LREC présentant la ressource : Ho-Dac L.-M., Fleury S., Ponton C. (2020). “É:Calm Resource: a Resource for Studying Texts Produced by French Pupils and Students”. Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020). pp 4327–4332. Marseille. 11–16 May 2020. ISBN: 979-10-95546-34-4. PDFLes textes qui composent la ressource sont également diffusées sur le site de chaque partenaire, avec certaines annotations complémentaires : Ecriscol : textes rédigés en classe et récupérés majoritairement en île de France avec, le cas échéant, différentes versions si le texte a fait l'objet de séances de réécriture et les interventions de l'enseignant : http://syled.univ-paris3.fr/ecriscol/CORPUS-TEST. Les textes sont systématiquement associés à une annotation des écarts à la norme orthographique. Resp. Serge Fleury et Claire DoquetLittéracie Avancée : textes effectuées à l'université et récupérés principalement à l'Université de Grenoble, tapuscrits (.doc, .odt) avec le cas échéant les commentaires de l'enseignant : https://www.ortolang.fr/market/corpora/litteracieavancee. Resp. Marie-Paule Jacques et Fanny RinckScolEdit textes rédigés selon 4 consignes (2 dictées + 2 rédactions) par les mêmes élèves du CP au CM2 (corpus longitudinal qui suit l'évolution des mêmes individus) : http://scoledit.org. Les textes ont été récupérés dans plusieurs académies françaises. Resp. Claude Ponton et Catherine BrissaudRésolCo textes rédigées selon une même consigne de rédaction et récupérées en Occitanie, Ile de France et Louvain-La-Neuve dans des classes de primaire, collège et master : http://redac.univ-tlse2.fr/corpus/resolco. Resp. Lydia-Mai Ho-Dac et Claudine Garcia-DebancVous trouverez en téléchargement un dossier corpus qui contient les transcriptions rangées par niveau et sous-corpus (pour l'instant seules les ressources issues du projet Ecriscol, ScolEdtit et Résolco sont intégrées)un dossier ecriscol qui à terme sera intégré dans le dossier corpusun dossier ecalm_txm qui contient toutes les transcriptions et un fichier nommé metadata.csv qui indique pour chaque transcription le sous-corpus associé, le niveau et la version (si la transcription est un brouillon -- V0, une première version -- V1, une nième version -- V2, V3, etc.)un fichier ECALM-2022-06-29.txm qui permet d'explorer le corpus via l'application TXM (https://textometrie.univ-montp3.fr/txm/).