Constitution et exploitation d’un corpus de français parlé parisien

Le but de cet article est double. Il s’agit d’abord d’introduire un nouveau corpus de français oral numérisé, accessible sans restriction sur le web. CFPP2000 (Corpus du français parlé parisien des années 2000), qui comporte actuellement 500 000 mots alignés à l’oral au tour de parole, est constitué par un ensemble d’interviews conversationnelles sur les quartiers de Paris d’une à deux heures qui ont été réalisées en dyades ou le plus souvent en triades. L’article envisage l’influence pour la constitution du corpus du but que nous nous étions fixé au départ, faciliter l’étude de la variation à l’oral pour le français parisien « commun ». Il aborde le choix des informateurs qui découle de cet objectif, les conduites d’entretien qui ont été adoptées. Il envisage ce qu’apporte la transcription d’entretiens relativement longs qui permet d’atténuer l’opposition entre analyse quantitative et analyse qualitative, ainsi que les précautions à prendre dans l’interprétation des résultats. Dans un deuxième temps, l’article présente les métadonnées, les concordanciers et les outils statistiques qui viennent enrichir le corpus et mentionne quelques travaux qu’il a permis de mener, tantôt en syntaxe de l’oral, tantôt autour de problèmes de variation morphologique.

Constitution et exploitation d’un corpus de français parlé parisien

Fiche du document

Mots-clés Fr En

Sujets proches En Fr

Citer ce document

Métriques

Partage / Export

Résumé Fr En

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines