Les technologies du Web pour la valorisation d’un patrimoine industriel textile en mouvement dans les Hauts-de-France

Fiche du document

Date

2021

Périmètre
Langue
Identifiants
Collection

Archives ouvertes




Citer ce document

Eric Kergosien et al., « Les technologies du Web pour la valorisation d’un patrimoine industriel textile en mouvement dans les Hauts-de-France », HAL-SHS : sciences de l'information, de la communication et des bibliothèques, ID : 10670/1.v5wyzl


Métriques


Partage / Export

Résumé Fr

Une question sociale importante dans le domaine du patrimoine culturel est liée à la collecte, l'analyse, la publication et la mise en valeur de la mémoire des acteurs du domaine, soit parlée ou écrite. La formalisation de l'information sur le patrimoine culturel constitue un véritable défi. Le volume et la diversité des ressources posent de nombreux problèmes tels que l’indexation des données, leur structuration et leur valorisation au sein d'une même base de connaissances. La plupart des tentatives de résolution des problèmes d'interopérabilité sémantique se concentrent sur la standardisation et le développement de structures communes telles que FRBR, FRBRoo, CIDOC CRM, etc. Parmi ces modèles, le CIDOC estune référence conceptuelle, modèle spécialement conçu pour la modélisation du patrimoine culturel. Ce modèle offre en effet un schéma commun de métadonnées rendant les concepts compréhensibles et interopérables.Afin d'aider les experts du domaine à produire et fournir des contenus numériques, nous adoptons une méthodologie en trois étapes qui permet de construire semi-automatiquement une représentation sémantique d'un domaine étudié à partir de documents hétérogènes. Tout d'abord, nous recueillons et formalisons l'historique par le biais d'entretiens avec les acteurs du domaine. Deuxièmement, notre système opère l'identification et l'extraction d'informations relatives au patrimoine culturel industriel à partir de milliers de documents textuels hétérogènes collectés auprès de ces acteurs (interviews, articles de journaux, etc.). L'approche proposée combine la projection lexicale avec des méthodes de fouille de textes pour améliorer l'identification de l'information pertinente. Enfin, nous présentons une première version de l'ontologie construite automatiquement au format OWL en utilisant le modèle CIDOC CRM comme base conceptuelle, pour fusionner toutes les informations extraites. Les expériences sont menées sur un corpus relatif au patrimoine industriel textile collecté grâce au projet DENIM.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en