1988
info:eu-repo/semantics/OpenAccess
Pierre Hubert et al., « A Model of Vocabulary Partition », HAL SHS (Sciences de l’Homme et de la Société), ID : 10670/1.fd3fc6...
On propose un modèle destiné à décrire le vocabulaire d'un corpus. Il est divisé en deux groupes : le vocabulaire général, utilisé quelles que soient les circonstances, et de plusieurs vocabulaires locaux ou "spécialisés", utilisés uniquement dans une partie du corpus. Les mots appartenant au vocabulaire général apparaissent partout dans le texte et leur rythme d'apparition peut être estimé grâce à la formule de Muller. Un paramètre de partition mesure le poids relatif des deux vocabulaires. Ce paramètre donne donc une estimation de la spécialisation du vocabulaire dans un texte ou un corpus. Ce modèle est utilisé pour mesurer l'accroissement du vocabulaire avec l'allongement du corpus, pour localiser les ruptures thématiques et stylistiques dans ce corpus et pour comparer différents textes du point de vue de leur richesse lexicale. On présente une application aux pièces de Racine.