Un grand corpus de référence du français parlé : état des lieux et perspectives

Fiche du document

Date

3 septembre 2008

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes




Citer ce document

Olivier Baude, « Un grand corpus de référence du français parlé : état des lieux et perspectives », HAL-SHS : linguistique, ID : 10670/1.k0phq3


Métriques


Partage / Export

Résumé Fr

Cette communication vise à interroger les concepts de "corpus de référence" et de "corpus représentatif" du français qui sont très largement utilisés dans la communauté scientifique depuis quelques années. Qu'est-ce qu'un corpus si représentatif qu'il en devient de référence ? De quoi est-il constitué ? Comment est-il collecté et exploité ? Quelle place pour les variétés et les variations diachroniques, diatopiques, diastratiques, diaphasiques du ou des français ?Pour répondre à ces questions, il s'agira tout d'abord de faire un état des lieux des usages de ces concepts et de leurs implications théoriques dans les grands projets, actuels ou en gestation, de constitution de corpus de français parlé (CRFP, PFC, CLAPI, VALIBEL, ESLO-VARILING, CIEL-F, Corpus de la parole, etc.).Dans un deuxième temps, je présenterai et discuterai les principaux choix théoriques et méthodologiques du Projet ESLO-VARILING de l'université d'Orléans dont l'objectif est la constitution d'un grand corpus prototypique de français parlé afin de mettre à disposition une banque de données de 10 millions de mots selon les principes suivants : (1) accumuler des heures de parole et développer une expérience critique sur leur mode de collecte et d’analyse, (2) créer des matériaux exploitables par les chercheurs et structurer la communauté « corpus », (3) ouvrir des champs d’investigation à l’ensemble des sciences humaines et apporter les attestations requises par la lexicographie ou l’élaboration de grammaires de référence. La troisième partie de ma communication présentera à partir des expériences présentées, des propositions concrètes, en termes de représentativité et d'usages, pour la constitution d'un vaste corpus de référence du français parlé dans le cadre institutionnel du programme Corpus de la parole de la Délégation générale à la langue française et aux langues de France du Ministère de la culture et du CNRS. Il s'agira in fine de concevoir une démarche de constitution de corpus variationnistes pour laquelle la réflexivité reste un élément fondateur d'une méthodologie qui observe et décrit mais aussi construit le français parlé comme objet scientifique.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en