2022
Cairn
Jean-Gabriel Ganascia, « Enjeux épistémologiques de la science des données », Annales des Mines - Réalités industrielles, ID : 10670/1.v59mrk
Après avoir rappelé ce qui fait la singularité des « masses de données », laquelle ne tient pas uniquement à leur volume, mais aussi à leur évolutivité et à leur variabilité, nous montrerons que tant leur accumulation que leur exploitation se sont révélées nécessaires pour les grands acteurs du Web et que cela tient à trois raisons liées à la spécificité des industries du numérique. Nous amorcerons ensuite une réflexion sur la science des données et sur l’opposition entre, d’un côté, ceux qui affirment que désormais les corrélations suffisent et, de l’autre, ceux qui s’en tiennent toujours à l’emploi de modèles et à la fonction épistémologique clef qu’ils occupent dans la démarche scientifique. Nous conclurons sur l’absence actuelle de cadre théorique mathématique de la science des données, tout en évoquant les théories anciennes, celles qui existaient dans les années 1990, et en ouvrant sur des progrès en ce sens.