20 décembre 2021
Open Access , http://purl.org/eprint/accessRights/OpenAccess
Marwa Elleuch, « Découverte des processus métiers à partir des Emails, un premier pas vers la gestion des processus métiers dans des systèmes d'information moins structurés », Theses.fr, ID : 10670/1.oau400
La fouille de processus vise à analyser les traces d'exécution des systèmes d'information (SI), utilisés dans le cadre des activités métiers, pour découvrir des connaissances sur les processus métiers (PM). D'importants travaux de recherche ont été menés dans ce domaine. Cependant, ils supposent généralement que ces traces d'exécution ont un niveau de structuration élevé. Cela signifie que: (i) ils sont composés d'enregistrements structurés, chacun capturant l'exécution d'une activité, et (ii) une partie des attributs des événements d'exécution (comme le nom de l'activité, l'horodatage) sont explicitement inclus dans ces enregistrements, ce qui facilite leur inférence. Néanmoins, les PM peuvent être entièrement ou partiellement réalisés dans des SI moins structurés générant des traces d’exécution de faible niveau de structuration. Les systèmes de courriels sont largement utilisés pour réaliser de manière collaborative des activités de PM. Cependant, leurs traces d’exécution sont de nature non-structurée de point de vue découverte des PM, ce qui empêche l’application directe des techniques existantes. Pour celles qui découvrent les PM à partir des courriels, elles: (i) nécessitent généralement une intervention humaine, et (ii) se sont limitées à la découverte des PM selon la perspective comportementale. Dans cette thèse, nous proposons de découvrir des fragments de PM à partir des courriels selon leurs perspectives fonctionnelles, données, organisationnelles et comportementales. Nous formalisons d'abord ces perspectives en considérant les spécificités des systèmes de courriels. Nous introduisons la notion de contribution des acteurs à la réalisation des activités pour enrichir les perspectives organisationnelles et comportementales. Nous considérons en outre les entités informationnelles manipulées par les activités de PM pour décrire la perspective des données. Pour automatiser la découverte de l’ensemble des perspectives, nous introduisons une approche complètement non-supervisée. Cette approche transforme principalement les traces non structurées des courriels en un journal d'événements structuré avant de l'analyser pour découvrir les PM selon différentes perspectives. Nous introduisons dans ce contexte un ensemble de solutions algorithmiques pour: (i) l'apprentissage non supervisé des activités basé sur la découverte de motifs fréquents de mots dans les courriels, (ii) la découverte des occurrences des activités dans les emails pour capturer les attributs des événements, (iii) la découverte des actes de parole des expéditeurs pour reconnaître leurs intentions de mentionner les activités dans les emails afin de déduire leurs contributions dans leur réalisation, (iv) le regroupement par chevauchement des activités pour découvrir leurs artefacts manipulés (c.-à-d. les entités informationnelles), et (v) la découverte des contraintes séquentielles entre les types d'événements pour découvrir la perspective comportementale des PM. Notre approche est validée en utilisant des courriels publics d’Enron. Nos résultats sont en outre rendus publics pour assurer la reproductibilité dans le domaine étudié. Nous montrons enfin l'utilité de nos résultats pour améliorer la gestion des PM à travers deux applications: (i) un outil de découverte et de recommandation des connaissances de PM à intégrer dans un système de gestion de courriels, et (ii) l'analyse de données CRM pour l'exploration des raisons de la satisfaction/non-satisfaction des utilisateurs.