Web sémantique et interopérabilité des vocabulaires: une expérimentation dans le domaine des enluminures

Fiche du document

Date

2008

Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess




Citer ce document

Anila Angjeli et al., « Web sémantique et interopérabilité des vocabulaires: une expérimentation dans le domaine des enluminures », HAL-SHS : sciences de l'information, de la communication et des bibliothèques, ID : 10670/1.pzqxmg


Métriques


Partage / Export

Résumé En Fr

Semantic search across collections described with heterogeneous metadata is an important problem in the Cultural Heritage field. This paper presents an experiment on enhancing the semantic interoperability of two digital iconographic collections: Mandragore, the iconographic database of the Manuscript Department of the French National Library (BnF), and the Medieval Illuminated manuscripts collection of the National Library of the Netherlands (KB). While the content of these two collections is similar, they have been processed differently. The vocabularies used to index their objects are both controlled and hierarchically organized Knowledge Organization Systems (KOS), but they do not have the same semantics and structure. The experiment presented here started with a precise analysis of each of these vocabularies. Then, each of them was represented in a standard model. This model, namely, SKOS, paves the way for semantic reconciliation of heterogeneous KOSs, on top of the RDF Semantic Web data model. Once this step has been taken, it is possible to use simple automatic techniques for matching the concepts of the two vocabularies at the semantic level, based on their lexical similarities. Finally, a prototype was built that exploits the information contained in the vocabularies and in their alignment, to allow for searching documents in both collections at the same time, using a single set of descriptors as query terms.

Pendant la période 2006-2007 une collaboration entre la Bibliothèque nationale de France et la Bibliothèque royale des Pays-Bas a eu lieu autour du projet néerlandais STITCH. Ce projet, à travers des expériences concrètes, explore l'axe sémantique de la recherche. Comment effectuer des recherches sémantiques simultanées à travers plusieurs collections patrimoniales numériques ? Les métadonnées ayant trait à l'analyse du contenu sont souvent hétérogènes. Outre l'exploitation des méthodes de mise en correspondance manuelle des entités sémantiquement comparables, STITCH explore les techniques du web sémantique, notamment l'alignement d'ontologies. Cette présentation porte sur l'expérience qui a été menée sur deux collections iconographiques numériques, Mandragore, base iconographique du département des Manuscrits de la Bibliothèque nationale de France et la Collection d'enluminures de la Bibliothèque royale des Pays-Bas. Les contenus des deux collections sont comparables mais le traitement documentaire et les vocabulaires utilisés pour l'indexation de leurs contenus sont très différents. Les deux vocabulaires Mandragore et Iconclass sont certes contrôlés et hiérarchisés mais ils diffèrent dans leur sémantique et dans leur structure. C'est précisément cette différence qui a intéressé le projet STITCH qui vise à étudier l'alignement automatique des deux vocabulaires. L'expérience collaborative a démarré avec l'analyse fine de chacun des vocabulaires : les concepts et leur représentation, les propriétés lexicales des termes, les relations sémantiques, etc. L'équipe de chercheurs néerlandais a ensuite étudié et mis en place des mécanismes d'alignement des deux vocabulaires. Les modèles d'origine étant différents, une conversion dans un formalisme pivot (standard commun) était nécessaire pour engager ensuite les procédures d'alignement. C'est le RDF / SKOS qui a été utilisé. L'expérience a abouti à la réalisation d'un prototype qui permet une interrogation simultanée des deux bases à partir d'une même interface. Les descripteurs de chacun des deux vocabulaires servent de termes de requête sur l'ensemble des images appartenant indifféremment à l'une ou l'autre des deux collections. Cette expérience n'est qu'une étape dans la recherche de solutions visant à faciliter la navigation entre les collections patrimoniales dont les métadonnées sont hétérogènes.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en