L'exploitation des grands corpus: Le bestiaire de la litterature francaise

Fiche du document

Date

1989

Type de document
Périmètre
Langue
Identifiants
Relations

Ce document est lié à :
info:eu-repo/semantics/altIdentifier/doi/10.1093/llc/4.2.121

Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess




Citer ce document

Étienne Brunet, « L'exploitation des grands corpus: Le bestiaire de la litterature francaise », HAL-SHS : linguistique, ID : 10.1093/llc/4.2.121


Métriques


Partage / Export

Résumé Fr

Les méthodes statistiques, qui sont toujours comparatives, permettent de comparer les uns aux autres des mots, des textes et plus précisément l’usage différencié des mots dans les textes. Les données de base prennent alors la forme d’un tableau à deux dimensions, où la cellule (i,j) contient la fréquence du mot i dans le texte j.Il suffit donc de choisir les mots (les lignes du tableau) et les textes ou ensembles de textes (les colonnes). Le logiciel STELLA, créé par Jacques Dendien pour l'exploration de FRANTEXT, permet très aisément de dresser la liste des premiers et des seconds , avant que la commande frequence ne soit lancée qui met en rapport les deux listes et établit le tableau à exploiter. Nous choisirons à titre de démonstration un cas facile et même trivial, où le doute n’est guère permis. Et nous nous proposerons de vérifier si Colette aime les chats et plus largement les bêtes, ou du moins si son vocabulaire, par quelque intempérance lexicale, porte témoignage de cet amour . Et fort de ce premier essai, nous étendrons l'enquête à l'ensemble des écrivains pour établir le bestiaire de la littérature française.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Exporter en