Le modèle "monomaniaque" un modèle statistique simple pour l'analyse exploratoire d'un corpus de textes

Fiche du document

Date

22 juin 2004

Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess




Citer ce document

Fabrice Clérot et al., « Le modèle "monomaniaque" un modèle statistique simple pour l'analyse exploratoire d'un corpus de textes », HAL-SHS : sciences de l'information, de la communication et des bibliothèques, ID : 10670/1.t0fu24


Métriques


Partage / Export

Résumé En Fr

The automatic clustering of text segments into thematically homogeneous groups is a difficult problem. In this paper, we study the performance of a simple probabilistic model, the "monomaniac" model. We first describe the model and the related EM-based estimation procedures; an application of this model to a English corpus of texts imported from the CKM ("Customer Knowledge Management") literature is then presented.

Regrouper les éléments d'un corpus de textes en segments thématiquement apparentés est un problème d'analyse exploratoire complexe. On explore dans cette communication les performances d'un modèle statistique simple, le modèle "monomaniaque". On décrit le modèle et sa procédure d'ajustement puis on illustre sa performance sur un problème de segmentation d'un corpus de textes anglais relatifs au CKM ("Customer Knowledge Management")..

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Exporter en