9 septembre 2021
http://creativecommons.org/licenses/by/ , info:eu-repo/semantics/OpenAccess
Jean-Damien Généro et al., « Transcrire et éditer des sources numérisées sur le travail dans l’industrie textile », HALSHS : archive ouverte en Sciences de l’Homme et de la Société, ID : 10670/1.f7dl5t
Les historiens et les historiennes se sont saisis des outils numériques depuis plusieurs décennies.Time Us s’est inscrit dans cette longue tradition en développant des méthodes expérimentalesde transcription (OCR) et de structuration (XML) automatique de fonds d’archives manuscritset de collections d’ouvrages. Les ensembles choisis pour illustrer ce travail sont les minutes desprocès-verbaux du conseil des prud’hommes de Paris (1847-1848, 1858, 1878) et lesmonographies des Ouvriers des deux mondes (1857-1913, 1930). Deux étapes seront exposées.La première est le processus d’analyse et de reproduction des structures logiques (minutes desaudiences prud’homales et sections des monographies), mené sur une ligne de crête entre lapart de la machine (automatisation des tâches) et celle de l’humain (vérifications et correctionsmanuelles). La deuxième est l’extraction des informations liées au textile dans lesmonographies et leur mise à disposition auprès des chercheur-euse-s. Des propositions serontenfin formulées quant aux usages possibles du numérique dans les programmes de recherche