6 octobre 2023
info:eu-repo/semantics/OpenAccess
François Loison, « Transformation des lots de données dans les systèmes d’information d’entreprise grâce à la théorie des graphes : application aux systèmes PLM », HAL SHS (Sciences de l’Homme et de la Société), ID : 10670/1.c3b3bd...
Les Systèmes d’Information structurée tels que les PLMs (Product Life Cycle Management) ou les ERPs (Enterprise Resource Planning) ont atteint un plateau de maturité et stockent jusqu’à des centaines de millions d’objets et de liens. Ces données sont vitales pour les processus des entreprises et le bon fonctionnement de leurs opérations. Fréquemment, elles font l’objet de projets de transformation tels que la migration vers un nouvel environnement, ou une réorganisation ayant pour but d’être en accord avec de nouveaux paradigmes métiers, le nettoyage, la purge, l’archivage, etc… Généralement, la complexité est liée à la topologie du graphe de relation entre les objets et les liens. Lors du cadrage d’un tel projet, il faut être capable de mesurer sa complexité en un temps très court afin d’estimer la charge nécessaire de manière fiable. D'autre part, certains projets de transformation de données présentent un haut degré de complexité. Leur analyse demande une approche holistique et une remise en cause de la structure des données ou de l'organisation des acteurs du projet. De telles transformations requièrent une stratégie « Diviser pour mieux Régner » : produire des lots de données faiblement couplés de manière à rendre la transformation de données gérable, itérative et atteignable. La plupart des méthodes de migration recommandent l’approche « Diviser pour mieux Régner » mais n’expliquent pas comment produire ces lots de données faiblement couplés. Il existe deux approches distinctes reposant sur une large gamme d’algorithmes : clustering et détection de communautés. Les lots de données produits doivent être signifiants pour le métier et doivent pouvoir être affichés dans une vue mésoscopique, disons une page de taille A3 ou A4, afin de pouvoir effectuer les choix tactiques de sélection des lots de données candidats au traitement effectif. Ces besoins ont engendré l'initiative Data Systemizer (D6) qui a élaboré une méthode-outillée dédiée aux projets de transformation de données permettant de faire émerger le meilleur lotissement de données et de le représenter graphiquement dans un formalisme naturel aux décideurs et de fournir des livrables clefs permettant de maîtriser l’exécution du projet. Le « graphe de données inextricable » doit ainsi devenir un ensemble clair et synthétique de lots liés entre eux, celui-ci étant optimisé mathématiquement pour minimiser les dépendances entre lots. Ce résultat est obtenu par une méthode de lotissement des données multi-passes permettant de combiner et séquencer les différentes passes algorithmiques. Pour les données PLM, une méthode de réduction des dépendances est proposée afin de produire une vue améliorée mésoscopique des lots de données.