18 juin 2012
Ce document est lié à :
info:eu-repo/semantics/reference/issn/1638-9808
Ce document est lié à :
info:eu-repo/semantics/reference/issn/1765-3126
All rights reserved , info:eu-repo/semantics/openAccess
Sonia Branca-Rosoff et al., « Constitution et exploitation d’un corpus de français parlé parisien », Corpus, ID : 10.4000/corpus.2033
Le but de cet article est double. Il s’agit d’abord d’introduire un nouveau corpus de français oral numérisé, accessible sans restriction sur le web. CFPP2000 (Corpus du français parlé parisien des années 2000), qui comporte actuellement 500 000 mots alignés à l’oral au tour de parole, est constitué par un ensemble d’interviews conversationnelles sur les quartiers de Paris d’une à deux heures qui ont été réalisées en dyades ou le plus souvent en triades. L’article envisage l’influence pour la constitution du corpus du but que nous nous étions fixé au départ, faciliter l’étude de la variation à l’oral pour le français parisien « commun ». Il aborde le choix des informateurs qui découle de cet objectif, les conduites d’entretien qui ont été adoptées. Il envisage ce qu’apporte la transcription d’entretiens relativement longs qui permet d’atténuer l’opposition entre analyse quantitative et analyse qualitative, ainsi que les précautions à prendre dans l’interprétation des résultats. Dans un deuxième temps, l’article présente les métadonnées, les concordanciers et les outils statistiques qui viennent enrichir le corpus et mentionne quelques travaux qu’il a permis de mener, tantôt en syntaxe de l’oral, tantôt autour de problèmes de variation morphologique.