Big data is not about size: when data transform scholarship

Résumé En Fr

“Big data” discussions typically focus on scale, i.e. the problems and potentials inherent in very large collections. Here, we argue that the most important consequences of “big data” for scholarship stem not from the increasing size of datasets, but instead from a loss of control over the sources of data. The breakdown of the “control zone” due to the uncertain provenance of data has implications for data integrity, and can be disruptive to scholarship in multiple ways. A retrospective look at the introduction of larger datasets in weather forecasting and epidemiology shows that more data can at times be counter-productive, or destabilize already existing methods. Based on these examples, we look at two implications of “big data” for scholarship: when the presence of large datasets transforms the traditional disciplinary structure of sciences, as well as the infrastructure for scholarly communication.

Alors que les débats sur les « données massives » tendent à se concentrer sur les difficultés et potentiels inhérents à leur taille, ce chapitre démontre que la perte de contrôle sur les sources de ces données est tout aussi importante à considérer. La provenance incertaine des données massives a des répercussions sur l’intégrité des données, et peut nuire à la recherche scientifique de multiples façons. Une analyse de l’introduction de grands ensembles de données dans les prévisions météorologiques et en épidémiologie démontre que l’accroissement des données peut être contre-productive, voire déstabiliser les méthodes déjà existantes. Sur la base de ces exemples, nous examinons deux implications des « big data » pour la recherche : les transformations de la structure disciplinaire traditionnelle des sciences ainsi que de l’infrastructure pour la communication scientifique.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en