14 juin 2021
Anja Martin-Scholz et al., « Causality put to the test of the big data movement: a communicational approach », HAL-SHS : sciences de l'information, de la communication et des bibliothèques, ID : 10670/1.qx4195
Les discours concourant au mouvement des Big Data laisse entendre que l’augmentation du volume de données et de la capacité de calcul permettrait à terme de faire émerger des causalités. Or, les statistiques, d’après Breiman (2001), se font selon deux types de stratégies : la « stratégie pour comprendre » et la « stratégie pour prévoir ». La stratégie pour comprendre s’inscrit dans le registre de la causalité et suppose d’être construit à partir de données protocolisées. De l’autre côté, les stratégies pour prévoir ne cherchent pas à expliciter un modèle mais à proposer des prédictions, des faits probables et s’appuient sur la volumétrie des données. Cette communication vise à questionner ainsi ces discours du big data, en prenant appui sur l’étude de la fabrique des données dans des Registres de cancer.