Développement d'un classifieur hybride pour le domaine des « Ressources Humaines »

Fiche du document

Auteur
Date

10 septembre 2020

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess




Citer ce document

Myriam Gafsi, « Développement d'un classifieur hybride pour le domaine des « Ressources Humaines » », DUMAS - Dépôt Universitaire de Mémoires Après Soutenance, ID : 10670/1.f09n0x


Métriques


Partage / Export

Résumé En Fr

In this work, we present an application of an automatic text classification system. In order to do so, we developed a product for a company that will be applied to a customer case : an automatic classifier for human resources survey responses, based on a hybrid system (machine learning on annotated data, coupled with expert rules and lexicons). The first approach is based on statistical techniques. It consists on performing multi-categorical annotation to train the model in order to classify the text. The second approach is symbolic. A taxonomy of the humain ressources domain has been developed for the establishment of semantic annotation on texts. We, then, developed a hybrid classification system. At the end, we present the results of evaluation measures to determine the performance of the classifier on our corpus.

Dans ce travail, nous avons cherché à présenter une application d’un système de classification automatique de textes. Pour cela, nous avons développé un produit pour une entreprise à des fins applicatives pour un client : un classifieur automatique pour des réponse d’enquêtes deressources humaines, fondé sur une méthode hybride (apprentissage automatique sur des données annotées, couplé avec des règles expertes et des lexiques). La première approche est basée sur des techniques statistiques. Elle consiste à effectuer une annotation multi-catégoriel permettant d’entraîner le modèle afin de classer le texte. La deuxième approche est symbolique. Une taxonomie du domaine a été élaborée dans un but d'annotation lexicale sémantique des textes. Par la suite, nous avons développé un système de classification hybride. Nous avons présenté à la fin les résultats des mesures d'évaluation pour déterminer les performances du classifieur sur nos corpus.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en