Data re-engineering in enterprise information systems powered by graph theory : application to PLM systems Transformation des lots de données dans les systèmes d’information d’entreprise grâce à la théorie des graphes : application aux systèmes PLM En Fr

Fiche du document

Date

6 octobre 2023

Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess



Sujets proches Fr

Traitement

Citer ce document

François Loison, « Transformation des lots de données dans les systèmes d’information d’entreprise grâce à la théorie des graphes : application aux systèmes PLM », HAL SHS (Sciences de l’Homme et de la Société), ID : 10670/1.c3b3bd...


Métriques


Partage / Export

Résumé En Fr

Structured enterprise information systems such as Product Lifecycle Management (PLM) and Enterprise Resources Planning (ERP) have reached a maturity plateau and are storing up to hundreds of millions of objects and links. These data are vital for enterprise processes and operations. They are frequently the subject of data transformation projects such as migration to a new environment, reorganisation aligned to new business paradigms, cleansing, purge and archive, etc. Generally, the complexity of data transformation is related to objects and links graph topology. When scoping such a project, it is necessary to quickly asset its complexity in order to reliably estimate project workload. Moreover, some dat transformation projects are very complex and their analysis requires an holistic approach and a refactoring of data structure or business activities organisation. To make data transformation manageable, iterative, and achievable, they require a "Divide and Conquer'' strategy therefore producing loosely cou pied data packages. Most data migration methods recommend "Divide and Conquer'' strategy but do not expia in how to produce these loosely cou pied data packages. There are two distinct approaches based on a wide range of algorithms: clustering and community detection. Data packages generated must be business meaningful and fit into a mesoscopic scale, say on an A3 or A4 page, to allow for tactical decision-making regarding the selection of candidate data packages for actual processing. A multi-pass tooled-up method able to combine and sequence data clustering approaches/algorithms has been developed for this purpose: Data Systemizer (D6). lt intends to transform the "inextricable source data graph" into a concise and clear set of data packages graph, optimized to minimize data packages dependencies. This result is obtained by a multi-passes packaging method using best algorithm pass by pass. Finally, a PLM specific clustering algorithm is proposed to improve data packages mesoscopic view.

Les Systèmes d’Information structurée tels que les PLMs (Product Life Cycle Management) ou les ERPs (Enterprise Resource Planning) ont atteint un plateau de maturité et stockent jusqu’à des centaines de millions d’objets et de liens. Ces données sont vitales pour les processus des entreprises et le bon fonctionnement de leurs opérations. Fréquemment, elles font l’objet de projets de transformation tels que la migration vers un nouvel environnement, ou une réorganisation ayant pour but d’être en accord avec de nouveaux paradigmes métiers, le nettoyage, la purge, l’archivage, etc… Généralement, la complexité est liée à la topologie du graphe de relation entre les objets et les liens. Lors du cadrage d’un tel projet, il faut être capable de mesurer sa complexité en un temps très court afin d’estimer la charge nécessaire de manière fiable. D'autre part, certains projets de transformation de données présentent un haut degré de complexité. Leur analyse demande une approche holistique et une remise en cause de la structure des données ou de l'organisation des acteurs du projet. De telles transformations requièrent une stratégie « Diviser pour mieux Régner » : produire des lots de données faiblement couplés de manière à rendre la transformation de données gérable, itérative et atteignable. La plupart des méthodes de migration recommandent l’approche « Diviser pour mieux Régner » mais n’expliquent pas comment produire ces lots de données faiblement couplés. Il existe deux approches distinctes reposant sur une large gamme d’algorithmes : clustering et détection de communautés. Les lots de données produits doivent être signifiants pour le métier et doivent pouvoir être affichés dans une vue mésoscopique, disons une page de taille A3 ou A4, afin de pouvoir effectuer les choix tactiques de sélection des lots de données candidats au traitement effectif. Ces besoins ont engendré l'initiative Data Systemizer (D6) qui a élaboré une méthode-outillée dédiée aux projets de transformation de données permettant de faire émerger le meilleur lotissement de données et de le représenter graphiquement dans un formalisme naturel aux décideurs et de fournir des livrables clefs permettant de maîtriser l’exécution du projet. Le « graphe de données inextricable » doit ainsi devenir un ensemble clair et synthétique de lots liés entre eux, celui-ci étant optimisé mathématiquement pour minimiser les dépendances entre lots. Ce résultat est obtenu par une méthode de lotissement des données multi-passes permettant de combiner et séquencer les différentes passes algorithmiques. Pour les données PLM, une méthode de réduction des dépendances est proposée afin de produire une vue améliorée mésoscopique des lots de données.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets