De petits corpus pour une grande base de données sur l’anglais oral contemporain : quels enjeux à la lumière du programme PAC ?

Fiche du document

Date

10 juillet 2018

Discipline
Type de document
Périmètre
Identifiant
Source

Corpus

Relations

Ce document est lié à :
info:eu-repo/semantics/reference/issn/1638-9808

Ce document est lié à :
info:eu-repo/semantics/reference/issn/1765-3126

Organisation

OpenEdition

Licences

All rights reserved , info:eu-repo/semantics/openAccess



Sujets proches Fr

anglais

Citer ce document

Cécile Viollain et al., « De petits corpus pour une grande base de données sur l’anglais oral contemporain : quels enjeux à la lumière du programme PAC ? », Corpus, ID : 10.4000/corpus.3222


Métriques


Partage / Export

Résumé Fr En

Le présent article prend pour point de départ de sa réflexion sur les enjeux épistémologiques et méthodologiques des petits corpus un constat simple, à savoir que ceux-ci ont survécu à l’heure où l’essor de la linguistique de corpus et le développement du big data ont multiplié les ressources. Cette survie est, selon nous, la preuve d’une nécessité à la fois matérielle et logistique et d’une pertinence scientifique des petits corpus que nous explorons sous l’angle particulier de la langue orale et du domaine spécifique de la phonologie. Nous montrons en quoi cette discipline entretient un rapport unique à l’objet langue et donc privilégié aux corpus et repensons la validité des corpus non pas en termes de taille, mais en termes de finalité. Nous défendons alors la méthodologie et les ambitions du programme PAC dont la base de données sur l’anglais oral contemporain repose exclusivement sur de petits corpus spécialisés constitués dans les différentes aires géographiques anglophones. Nous démontrons non seulement la pertinence individuelle de ces petits corpus pour l’étude quantitative et qualitative de phénomènes précis, comme le nivellement de la variété mancunienne dans le nord de l’Angleterre ; mais également l’apport concret de la comparabilité et de la jonction possible des analyses faites à partir de ces petits corpus pour la modélisation théorique des phénomènes de rhoticité et de r de sandhi dans les variétés d’anglais parlées à travers le monde. Ainsi, nous illustrons la manière dont les résultats obtenus grâce à l’étude en profondeur des petits corpus PAC permettent de penser la dynamique des systèmes de l’anglais ainsi que le poids sociolinguistique des identités, notamment nord-sud, dans la description et la compréhension de leurs caractéristiques phonético-phonologiques. Aussi, en défendant les petits corpus, nous défendons en creux la phonologie de corpus, et nous remettons en cause la supériorité automatique des grands corpus pour ce qui est de l’analyse en profondeur de la langue orale et de l’évolution des variétés d’anglais parlées à travers le monde.

The present article takes a simple observation as a starting point for its subsequent reflection on the epistemological and methodological issues surrounding the resort to small corpora: the latter have survived when the rise of corpus linguistics and the development of big data have multiplied resources. To us, this survival is proof of the material and logistical necessity as well as the scientific relevance of small corpora, which we explore from the particular angle of spoken language and within the specific domain of phonology. We explain why this field has a unique connection to its linguistic object and consequently a privileged relation to corpora and rethink the viability of corpora not in terms of size but in terms of purpose. We then defend the methodology and ambitions put forward by the PAC program whose database on contemporary oral English exclusively relies on small specialized corpora built in the various English-speaking areas around the world. Not only do we demonstrate how relevant these small corpora are individually for the quantitative and qualitative study of specific phenomena, such as levelling in the Mancunian variety of northern English for instance, but also show how they collectively allow for the comparative and cumulative analysis as well as the theoretical modelling of such phenomena as rhoticity and r-sandhi in the different varieties of English spoken worldwide. Therefore, we illustrate how the results yielded by the in-depth study of the small PAC corpora help us take into account the system dynamics of the varieties of English and the sociolinguistic weight of local identities, especially along the north-south axis, in the description and understanding of their phonetic and phonological characteristics. In addition, by supporting small corpora, we implicitly defend corpus phonology and question the automatic superiority that large corpora enjoy as far as the in-depth analysis of spoken language and of the evolution of the varieties of English spoken worldwide is concerned.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en