Vers un outillage informatique optimisé pour corpus langagiers oraux en vue d’une exploitation textométrique : le cas des interrogatives partielles dans ESLO

Flora Badin et al., « Vers un outillage informatique optimisé pour corpus langagiers oraux en vue d’une exploitation textométrique : le cas des interrogatives partielles dans ESLO », Corpus, ID : 10.4000/corpus.5752

Partage / Export

Résumé Fr En

Pour répondre aux problématiques engendrées par la diffusion de plus en plus massive des corpus linguistiques et à l’hétérogénéité de leurs formats, nous proposons une méthode permettant de prendre en main des corpus langagiers oraux et de les convertir dans un format permettant leur exploitation outillée. Pour cette recherche, le corpus ESLO nous sert d’exemple par sa licence de diffusion, son format, son volume et ses atouts sociolinguistiques et diachroniques. Notre travail se fonde sur la compilation de ce corpus pour le rendre compatible avec l’outil de textométrie TXM. Nous opérons un ensemble de transformations des données pour l’utiliser au mieux. Enfin, pour illustrer les apports de ces avancées méthodologiques, nous proposons une analyse fine et multidimensionnelle de l’usage des interrogatives dans le corpus ESLO.

Vers un outillage informatique optimisé pour corpus langagiers oraux en vue d’une exploitation textométrique : le cas des interrogatives partielles dans ESLO

Fiche du document

Mots-clés Fr En

Sujets proches Fr

Citer ce document

Métriques

Partage / Export

Résumé Fr En

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en