30 décembre 2016
Ce document est lié à :
info:eu-repo/semantics/reference/issn/2493-4437
info:eu-repo/semantics/openAccess
Jean-Philippe Moreux, « Approches innovantes pour la presse ancienne numérisée : fouille et visualisation de données », Carnet de la Bibliothèque nationale de France, ID : 10.58079/m387
Cet article décrit comment une technique innovante de reconnaissance de mise en page (OLR, optical layout recognition) appliquée lors d'un grand projet européen de numérisation de la presse ancienne (Europeana Newspapers, 2012-2015) a été utilisée dans une expérience de fouille de données ciblant les métadonnées quantitatives de quotidiens numérisés. Les fichiers numériques de six titres de journaux français des collections de la BnF ont ainsi été analysés avec des techniques d'extraction et...