Les Eslos, un corpus variationniste représentatif d’une communauté d’auditeurs ?

Fiche du document

Date

4 juin 2009

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes




Citer ce document

Olivier Baude, « Les Eslos, un corpus variationniste représentatif d’une communauté d’auditeurs ? », HAL-SHS : linguistique, ID : 10670/1.jocn1u


Métriques


Partage / Export

Résumé Fr

Dès son élaboration à la fin des années soixante, l’enquête sociolinguistique à Orléans (ESLO1) est présentée par ses auteurs comme un grand corpus représentatif. De même l’objectif annoncé d’une enquête qui est en cours de réalisation en 2008-2010 (ESLO2 ) par le laboratoire Ligérien de Linguistique à Orléans, est de produire un nouveau corpus oral d’environ 400 heures (soit 6 millions de mots), analysé de façon interne et comparative, qui contribuerait à la définition des critères pertinents pour élaborer un « échantillon pertinent du français d’aujourd’hui». La constitution de ce corpus s’inscrit alors dans une démarche qui vise à définir les propriétés d’un corpus de référence selon une méthodologie de constitution de données impliquant la prise en compte de l’intégralité des différentes étapes de l’élaboration afin d'anticiper les contraintes et leurs impacts sur l'analyse et les théories linguistiques.Cet objectif pose différentes questions tant théoriques que méthodologiques. Ainsi, les concepts de « corpus de référence » ou « corpus représentatif » sont fréquemment utilisés dans la linguistique de corpus oral sans que ceux-ci semblent être clairement définis. Qu'est-ce qu'un corpus si représentatif qu'il en devient de référence ? De quoi est-il constitué ? Comment est-il collecté et exploité ? Quelle place pour les variétés et les variations diachroniques, diatopiques, diastratiques, diaphasiques du ou des français ? La communication proposée vise à présenter et mettre en perspective les principaux choix théoriques et méthodologiques du projet ESLO pour la constitution d’un corpus « représentatif d’une communauté d’auditeur ». Il s’agira en premier lieu de mettre en relief la difficulté de concevoir un grand corpus répondant aux contraintes, notamment techniques, d’homogénéisation, dans le cadre de la linguistique variationniste qui donne toute sa place à l’hétérogénéité des pratiques linguistiques. Cette approche permettra notamment de définir la notion de « communauté d’auditeur ».Je présenterai ensuite les choix méthodologiques de constitution d’un échantillon définissant une communauté linguistique hétérogène au regard des théories de stratification sociale, de sociologie des réseaux et de capital linguistique ; ainsi que ceux reposant sur une typologie fine des situations de communication. L’explicitation de ces choix, reconnue comme l’élément fondamental d’une démarche réflexive indispensable, permettra alors de définir l’impact de la méthodologie de constitution du corpus dans l’analyse des données linguistiques.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en