Towards a general open dataset and model for late medieval Castilian text recognition (HTR/OCR)

Fiche du document

Date

16 octobre 2023

Discipline
Type de document
Périmètre
Langue
Identifiants
Relations

Ce document est lié à :
info:eu-repo/semantics/altIdentifier/doi/10.46298/jdmdh.10416

Collection

Archives ouvertes



Citer ce document

Matthias Gille Levenson, « Towards a general open dataset and model for late medieval Castilian text recognition (HTR/OCR) », HAL-SHS : histoire, ID : 10.46298/jdmdh.10416


Métriques


Partage / Export

Résumé En

This paper introduces a first HTR/OCR open access gold corpus for spanish late medieval sources, basedon the allographetic transcription of more than 300 pages of several manuscripts of the Regimiento de losPrínçipes, as well as a first set of general transcription and regions/lines segmentation models trained withKraken. These models are evaluated with in-domain and out-of-domain data.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en