A Model of Vocabulary Partition

Fiche du document

Date

1988

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess




Citer ce document

Pierre Hubert et al., « A Model of Vocabulary Partition », HAL SHS (Sciences de l’Homme et de la Société), ID : 10670/1.fd3fc6...


Métriques


Partage / Export

Résumé En Fr

The model proposed here is used to describe the vocabulary of a corpus. It is divided into two groups: general vocabulary which is used whatever the circumstances and several local (or 'specialized') vocabularies, each of which is used in only one part of the corpus. General words may appear everywhere in the text and their increase with corpus length can be estimated with Muller's formula. In this model, a partition parameter measures the relative importance of both types of vocabularies: so the value of this parameter gives an estimation of the lexical 'specialization' in the text. This model has been applied to Racine's plays and can also be used to measure the increase of vocabulary with corpus length, to locate stylistic changes or to compare several texts from the point of view of their lexical richness.

On propose un modèle destiné à décrire le vocabulaire d'un corpus. Il est divisé en deux groupes : le vocabulaire général, utilisé quelles que soient les circonstances, et de plusieurs vocabulaires locaux ou "spécialisés", utilisés uniquement dans une partie du corpus. Les mots appartenant au vocabulaire général apparaissent partout dans le texte et leur rythme d'apparition peut être estimé grâce à la formule de Muller. Un paramètre de partition mesure le poids relatif des deux vocabulaires. Ce paramètre donne donc une estimation de la spécialisation du vocabulaire dans un texte ou un corpus. Ce modèle est utilisé pour mesurer l'accroissement du vocabulaire avec l'allongement du corpus, pour localiser les ruptures thématiques et stylistiques dans ce corpus et pour comparer différents textes du point de vue de leur richesse lexicale. On présente une application aux pièces de Racine.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines