La recherche en plein texte dans les sources manuscrites médiévales : enjeux et perspectives du projet HIMANIS pour l’édition électronique

Fiche du document

Date

9 février 2018

Discipline
Type de document
Périmètre
Langue
Identifiant
Source

Médiévales

Relations

Ce document est lié à :
info:eu-repo/semantics/reference/issn/0751-2708

Ce document est lié à :
info:eu-repo/semantics/reference/issn/1777-5892

Organisation

OpenEdition

Licences

All rights reserved , info:eu-repo/semantics/openAccess




Citer ce document

Dominique Stutzmann et al., « La recherche en plein texte dans les sources manuscrites médiévales : enjeux et perspectives du projet HIMANIS pour l’édition électronique », Médiévales, ID : 10.4000/medievales.8198


Métriques


Partage / Export

Résumé Fr En

HIMANIS (Historical MANuscript Indexing for user-controlled Search) est un projet de recherche européen, associant, sous le pilotage de l’IRHT (CNRS, France), la société innovante A2iA (France), la Rijksuniversiteit Groningen (Pays-Bas) et l’Universitat Politècnica de València (Espagne). Il vise à l’indexation du texte des registres de la chancellerie royale française des années 1302-1483, conservés aux Archives nationales sous les cotes JJ35 à JJ211, à partir des images produites par leur numérisation. Les enjeux de recherche d’information (données massives et bruitées) permettent de conjoindre les enjeux technologiques (reconnaissance de l’écriture manuscrite) et historiques (analyses paléographiques et diplomatiques, recherche sur les institutions, le fonctionnement de la monarchie, la naissance de l’État-nation). La présente contribution propose un modèle d’accès à l’information dans un corpus de données massives, d’un point de vue tant ergonomique qu’herméneutique. À cette fin, après une présentation du corpus, des outils actuels pour accéder à l’information qu’ils contiennent et de leur formalisation en TEI, elle problématise l’édition électronique comme « vérité terrain » et « terrain d’apprentissage », en renversant l’approche classique de l’édition critique comme finalité. Enfin, elle décrit le modèle d’accès proposé, à la fois pour une approche par « indexation » (et non par transcription) et pour une granularité par acte.

HIMANIS (Historical MANuscript Indexing for usercontrolled Search) is a European research project involving the innovative A2iA company (France), the Rijksuniversiteit Groningen (the Netherlands) and the Universitat Politècnica de València (Spain). It aims at indexing the full manuscript text of the Royal French Chancery registers from their digital images from 1302 to 1483, kept in the National Archives under the call numbers JJ35 to JJ211. The challenges for information retrieval in these registers (massive and noisy data) combine both technological (recognition of handwriting) and historical issues (paleographic and diplomatic analyzes, research on institutions, the functioning of the monarchy, national state genesis) issues. This paper proposes a model for accessing information in a massive body of data, both from an ergonomic point of view and from an hermeneutic one. To this end, after presenting the corpus, the current tools for accessing information contained in the corpus and their formalization in TEI format, it challenges electronic publishing as a “ground truth” and as “training data”, by aiming to reverse the classical approach of critical editions. Finally, it describes the proposed access model, both for an “indexing” approach (which is not a transcription) and for a granularity per act.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en