Grands corpus et linguistique outillée pour l'étude du français en interaction (plateforme CLAPI et corpus CIEL)

Fiche du document

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes




Citer ce document

Groupe Icor et al., « Grands corpus et linguistique outillée pour l'étude du français en interaction (plateforme CLAPI et corpus CIEL) », HALSHS : archive ouverte en Sciences de l’Homme et de la Société, ID : 10670/1.gt91qw


Métriques


Partage / Export

Résumé Fr

Cet article s'inscrit dans le domaine des grands corpus de langue en interaction - plus particulièrement des corpus de français - et présente différents enjeux théoriques et analytiques posés par le traitement de ces corpus. L'article se fonde sur les expériences menées au laboratoire ICAR depuis la fin des années 90, qui ont permis de constituer la base de données de corpus CLAPI (Corpus de Langue Parlée en Interaction). Il intègre aussi un projet en cours, qui vise la constitution d'un grand corpus de français international, CIEL. Après avoir décrit la manière dont est conçue la base de données de corpus d'interaction - en parcourant un certain nombre de problèmes et de solutions, relatifs aux choix de recueil des données, à la transcription, à l'anonymisation, mais aussi au développement d'outils facilitant le traitement de grandes masses de données - , nous exposons quelques questions d'analyse auxquelles ces corpus permettent d'envisager des réponses.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en