E-CALM écriture scolaire

Fiche du document

Date

21 juin 2023

Discipline
Type de document
Langue
Identifiant
  • 11403/E-CALM
Source

ORTOLANG

Collection

Ortolang

Organisation

Équipex ORTOLANG

Licences

free_for_non_commercial_use , Libre sans utilisation commerciale , Free for non commercial use , licence Creative Commons Attribution - Pas du2019Utilisation Commerciale - Pas de Modification 3.0 non transposé



Sujets proches Fr

Pont flottant

Citer ce document

Claude Ponton et al., « E-CALM écriture scolaire », ORTOLANG


Partage / Export

Résumé Fr En

Corpus de transcriptions d’écrits d’élèves et d’étudiants (du CP au lycée) encodé selon la TEI-P5 incluant l'annotation des traces d'écritures (ratures, insertions, etc.). Ce corpus a été constitué dans le cadre du projet ANR E-CALM (http://e-calm.huma-num.fr/) coordonné par Claire Doquet. Claude Ponton, Claire Doquet, Serge Fleury, Lydia Mai Ho-Dac (2022). E-CALM [Corpus]. ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr, v2.1, https://hdl.handle.net/11403/e-calm/v2.1.Plus d'information dans l'article LREC présentant la ressource : Ho-Dac L.-M., Fleury S., Ponton C. (2020). “É:Calm Resource: a Resource for Studying Texts Produced by French Pupils and Students”. Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020). pp 4327–4332. Marseille. 11–16 May 2020. ISBN: 979-10-95546-34-4. PDFLes textes qui composent la ressource sont également diffusées sur le site de chaque partenaire, avec certaines annotations complémentaires : Ecriscol : textes rédigés en classe et récupérés majoritairement en île de France avec, le cas échéant, différentes versions si le texte a fait l'objet de séances de réécriture et les interventions de l'enseignant : http://syled.univ-paris3.fr/ecriscol/CORPUS-TEST. Les textes sont systématiquement associés à une annotation des écarts à la norme orthographique. Resp. Serge Fleury et Claire DoquetLittéracie Avancée : textes effectuées à l'université et récupérés principalement à l'Université de Grenoble, tapuscrits (.doc, .odt) avec le cas échéant les commentaires de l'enseignant : https://www.ortolang.fr/market/corpora/litteracieavancee. Resp. Marie-Paule Jacques et Fanny RinckScolEdit textes rédigés selon 4 consignes (2 dictées + 2 rédactions) par les mêmes élèves du CP au CM2 (corpus longitudinal qui suit l'évolution des mêmes individus) : http://scoledit.org. Les textes ont été récupérés dans plusieurs académies françaises. Resp. Claude Ponton et Catherine BrissaudRésolCo textes rédigées selon une même consigne de rédaction et récupérées en Occitanie, Ile de France et Louvain-La-Neuve dans des classes de primaire, collège et master : http://redac.univ-tlse2.fr/corpus/resolco. Resp. Lydia-Mai Ho-Dac et Claudine Garcia-DebancVous trouverez en téléchargement un dossier corpus qui contient les transcriptions rangées par niveau et sous-corpus (pour l'instant seules les ressources issues du projet Ecriscol, ScolEdtit et Résolco sont intégrées)un dossier ecriscol qui à terme sera intégré dans le dossier corpusun dossier ecalm_txm qui contient toutes les transcriptions et un fichier nommé metadata.csv qui indique pour chaque transcription le sous-corpus associé, le niveau et la version (si la transcription est un brouillon -- V0, une première version -- V1, une nième version -- V2, V3, etc.)un fichier ECALM-2022-06-29.txm qui permet d'explorer le corpus via l'application TXM (https://textometrie.univ-montp3.fr/txm/).

Corpus of handwritten manuscripts written by French pupils and students (from 3rd grade to highschool) encoded according TEI-P5, including annotations of graphical revisions. The corpus was built as part of the ANR project E-CALM (http://e-calm.huma-num.fr/). See the LREC article for further information:Ho-Dac L.-M., Fleury S., Ponton C. (2020). “É:Calm Resource: a Resource for Studying Texts Produced by French Pupils and Students”. Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020). pp 4327–4332. Marseille. 11–16 May 2020. ISBN: 979-10-95546-34-4. PDFThe E-Calm resource takes part from the pooling of 4 data sets that are also available with annotation layers on the partner's website:EcriScol (http://www.univ-paris3.fr/ecriscol): texts handwritten by students at school without predefined instructions. A large part of these texts contains teacher comments and are associated with drafts and intermediate versions. Texts are annotated in misspellings.Advanced Literacy (https://www.ortolang.fr/market/corpora/litteracieavancee): texts typewritten by students at university without predefined instructions. A large part of these texts contains teacher comments. e composed with typewritten texts.Scoledit (http://www.scoledit.org/scoledit): handwritten texts produced at primary school in reply to specific instructions (2 narratives and 2 dictations ). This data set is longitudinal i.e. the texts have been written by the same individuals throughout all their elementary grades. This corpus allows studies focusing on the individual evolution of language skills. . longitudinal corpus of texts. Texts are annotated in misspellings.ResolCo (http://redac.univ-tlse2.fr/corpus/resolco.html): handwritten and typewritten texts produced at primary scholl, highschool and University in reply to a specific instruction which has been designed for causing strategies in terms of discourse coherence and confronting the writer to cohesion problems such as anaphora, encapsulation, sequence of tenses, generic vs. specific mood. Texts are annotated in misspellings and discourse structures (minimal discourse units, discourse relations and referential continuities).

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en