2021
Cairn
de Valeriola Sébastien, « L’ordinateur au service du dépouillement de sources historiques : Éléments d’analyse semi-automatique d’un corpus diplomatique homogène », Histoire & mesure, ID : 10670/1.0y43v8
L’historien qui mobilise un corpus d’actes est amené à extraire de chacun de ces documents une série d’informations nécessaires à son étude, comme les noms des protagonistes, les dates, les montants, etc. Lorsque la taille de l’ensemble documentaire considéré est importante, cette étape de dépouillement peut poser un problème. Nous présentons ici une méthodologie d’analyse semi-automatique d’un tel corpus mettant en œuvre des méthodes quantitatives. Nous nous concentrons sur trois étapes de ce processus : le découpage des actes en sous-parties, la lemmatisation des anthroponymes et l’extraction des dates. Nous soulignons l’importance de l’intervention de l’humain après l’action de la machine, étape indispensable de tout dispositif d’analyse de ce type.