Data Curation to Reveal True Historical Uncertainty: From Navigocorpus to Portic, an Interdisciplinary Story of Dirty Data Cleaning Curation en interdisciplinarité d’une base de données historique : de Navigocorpus à Portic, ou de la qualification de l’incertitude En Fr

Fiche du document

Date

1 décembre 2023

Type de document
Périmètre
Langue
Identifiants
Relations

Ce document est lié à :
info:eu-repo/semantics/altIdentifier/doi/10.4000/histoiremesure.19833

Collection

Archives ouvertes

Licence

http://hal.archives-ouvertes.fr/licences/copyright/




Citer ce document

Christine Plumejeaud-Perreau et al., « Curation en interdisciplinarité d’une base de données historique : de Navigocorpus à Portic, ou de la qualification de l’incertitude », HAL-SHS : histoire, ID : 10.4000/histoiremesure.19833


Métriques


Partage / Export

Résumé En Fr

Interdisciplinary collaboration between computer scientists and historians has been paving the way for innovative analyses, notably through the ability of computer tools to aggregate or disaggregate massive data. While these tools appear to deliver “clean” data, they mask the fact that data are a construct, and “imperfect” (contradictory, incomplete, imprecise) in nature. This article explains the process of data curation and uncertainty qualification performed during the “Portic” research project. Intense discussions and negotiation of our different disciplinary priorities and practices were necessary to propose data visualizations showing the degree of historical interpretation so that historians can literally take the measure of the uncertainty of the future of the past.

La collaboration entre informaticiens et historiens ouvre la voie à des analyses inédites, grâce notamment à la capacité des outils informatiques d’agréger ou désagréger des masses considérables de données. Ces outils semblent cependant livrer une donnée formalisée « propre », en masquant qu’elle est un « construit », et son caractère « imparfait » (contradictoire, lacunaire, imprécis). Cet article montre le processus de curation des données et de qualification de l’incertitude expérimenté lors du programme ANR « Portic ». Fruit de discussions serrées et de choix au cas par cas, ce processus a été le préalable nécessaire pour proposer une visualisation de ces données laissant apparaître quelle est la place de l’interprétation historique et pour aider l’historien à prendre littéralement la mesure de l’incertitude du futur du passé.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Exporter en