2020
Ce document est lié à :
info:eu-repo/semantics/reference/issn/1278-3366
Ce document est lié à :
https://hdl.handle.net/20.500.13089/f36w
Ce document est lié à :
https://doi.org/10.4000/cybergeo.33741
info:eu-repo/semantics/openAccess , https://creativecommons.org/licenses/by/4.0/
Antoine Peris et al., « One century of information diffusion in the Netherlands derived from a massive digital archive of historical newspapers: the DIGGER dataset », Cybergeo : revue européenne de géographie / European journal of geography
Les données couvrant de longues périodes temporelles sont relativement rares pour l’étude des villes et pourtant essentielles à la compréhension du temps long de leurs dynamiques. Ce problème est prégnant pour les données sur les relations interurbaines, à l’échelle des systèmes de ville. Au cours des deux dernières décennies, d’importants efforts de numérisation de textes anciens ont été entrepris, notamment de livres et de journaux qui constituent des sources très riches sur les sociétés qui les ont produites. Des chercheurs ont récemment montré que ces archives numériques massives peuvent être utilisées pour identifier des tendances macroscopiques en rapport avec des changements historiques et culturels. En revanche, peu d’études se sont intéressées à la richesse de l’information géographique qui peut être extraite de ces archives. Dans cet article, nous présentons DIGGER, une base de données construite à partir de Delpher, l’archive de journaux historiques numérisés de la Bibliothèque Nationale des Pays-Bas. Cette base a été construite suite à l’analyse du contenu de 102 millions d’articles et petites annonces publiés dans 81 journaux locaux de 29 villes néerlandaises dont la publication s’étale de 1869 à 1994. Nous présentons ici les différentes étapes nécessaires à la constitution de la base de données ainsi que la validation de notre algorithme identifiant les noms de lieux. Cette base de données peut être utilisée pour analyser plus d’un siècle de développement du système urbain des Pays-Bas ainsi que pour l’étude de la diffusion des informations ou des biais spatiaux dans la couverture médiatique.