Resources for the Study of the Names of Ancient Classical Artworks : Corpora, Dictionaries and Automatic Recognition Tool Ressources pour l’étude des appellations d’oeuvres visuelles de l’Antiquité classique : corpus, dictionnaires et outil de reconnaissance automatique En Fr

Fiche du document

Discipline
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

http://creativecommons.org/licenses/by-nc-nd/




Citer ce document

Aurore Lessieux et al., « Ressources pour l’étude des appellations d’oeuvres visuelles de l’Antiquité classique : corpus, dictionnaires et outil de reconnaissance automatique », HAL-SHS : sciences de l'information, de la communication et des bibliothèques, ID : 10670/1.4bjfzy


Métriques


Partage / Export

Résumé En Fr

The multidisciplinary project MonumenTAL aims to identify and classify the titles and appellations given to ancient works of art by using NLP and text mining methods. This project involves a close collaboration between art historians (LIMC), NLP researchers (MoDyCo), curators and librarians (BnF). This presentation is focused on a specific part of the project, namely the analysis of texts written in French and published between the 18th and the 21st century. Our procedure involves several stages : selection of the textual corpus of study, elaboration of a typology of appellations, constitution of an annotated corpus (annotated manually by experts in the field), creation of reusable dictionaries of terms, of a new thesaurus of artworks name and development of a tool for automatic recognition of appellations based on symbolic methods.

Le projet pluridisciplinaire MonumenTAL a pour objectif de repérer et répertorier les appellations d’oeuvres d’art de l’Antiquité classique en utilisant les méthodes du TAL etd’en étudier l’élaboration et l’évolution dans différents types de publications. Il repose sur une collaboration étroite entre historiens de l’art (LIMC), linguistes-TAListes (MoDyCo), conservateurs et bibliothécaires (BnF). Le corpus est constitué de textes en français publiés du XVIIIe au XXIe siècle. Le traitement proposé implique plusieurs étapes : sélection du corpus textuel d’étude, élaboration d’une typologie des appellations, constitution d’un corpus annoté manuellement par les experts du domaine, création et réutilisation de dictionnaires de termes, création d’un nouveau thésaurus des noms d’oeuvres d’art et développement d’un outil de reconnaissance automatique des appellations fondé sur des méthodes symboliques.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en