Reconhecimento automático de manuscritos para o teste de idiomas não latinos

Fiche du document

Date

15 mars 2024

Type de document
Périmètre
Langue
Identifiants
Relations

Ce document est lié à :
info:eu-repo/semantics/altIdentifier/doi/10.46430/phpt0046

Collection

Archives ouvertes

Licence

http://creativecommons.org/licenses/by/



Citer ce document

Chahan Vidal-Gorène et al., « Reconhecimento automático de manuscritos para o teste de idiomas não latinos », HAL-SHS : histoire, ID : 10.46430/phpt0046


Métriques


Partage / Export

Résumé Pt

Este tutorial tem como objetivo descrever as boas práticas para a criação de conjuntos de dados e para a especialização dos modelos em função de um projeto HTR (Handwritten Text Recognition – em português, Reconhecimento de Texto Manuscrito) ou OCR (Optical Character Recoginition – em português, Reconhecimento Ótico de Caracteres) de documentos que não utilizam o alfabeto latino e, portanto, para os quais não existe ou é muito escassa a existência de dados para processamento. Assim, este tutorial visa mostrar abordagens de "minimal computing" (em português, computação mínima) para analisar coleções digitais de grande escala em línguas não latinas. O nosso tutorial concentrar-se-á num exemplo em grego antigo, propondo uma abertura ao tratamento de manuscritos em árabe magrebino.

document thumbnail

Par les mêmes auteurs

Exporter en