Des métadonnées et paradonnées pour mieux exploiter des données d’enquêtes pour la recherche

Fiche du document

Date

2021

Type de document
Périmètre
Langue
Identifiants
Organisation

Sciences Po

Licences

http://creativecommons.org/licenses/by-sa/ , info:eu-repo/semantics/OpenAccess




Citer ce document

Valentin Brunel et al., « Des métadonnées et paradonnées pour mieux exploiter des données d’enquêtes pour la recherche », Archive ouverte de Sciences Po (SPIRE), ID : 10670/1.sk69c5


Métriques


Partage / Export

Résumé En

Selon Jillian C. Wallis, Elizabeth Rolando, Christine L. Borgman [1] le partage des données se fait en fonction du type de recherche par lequel les données sont produites et réutilisées. Les données issues de la « grande science » (grandes équipes, projets à long terme, instrumentation étendue) seront volumineuses, avec une structure cohérente. À l'inverse, dans la « petite science », qui est appelée « la longue traîne » de la science, les individus et les petites équipes collectent des données pour des projets spécifiques, de petit volume, ayant un caractère local, et destinées à être utilisées uniquement par ces équipes. Elles sont moins susceptibles d'être structurées de manière à permettre un transfert facile des données entre équipes ou individus. Alors que les données issues « de la grande science » retiennent l'attention, la « petite science et la longue traîne » semblent constituer la majeure partie du financement scientifique. Rendre les données de longue traîne découvrables et réutilisables devient un défi majeur pour que le financement public soit profitable au plus grand nombre. Les institutions comme le Centre de données socio-politiques (CDSP), qui valorisent et diffusent majoritairement des données « de longue traîne » peuvent jouer un rôle majeur dans ce contexte. Depuis 15 ans, le CDSP, UMS du CNRS et de Sciences Po et partenaire de la TGIR PROGEDO [2], a développé une expertise solide dans la valorisation et l’ouverture des « petites données » de la recherche selon des principes FAIR. Il documente et diffuse notamment des enquêtes de sociologie et de science politique issues de méthodes quantitatives et qualitatives en vue de leur réutilisation. Pour ce faire, les membres du CDSP participent activement aux travaux de la communauté du standard de métadonnées Data Documentation initiative (DDI). Par ailleurs, le panel longitudinal probabiliste ELIPSS (Étude Longitudinale par Internet Pour les Sciences Sociales) a été l'occasion de collecter au CDSP de riches paradonnées - données recueillies lors du processus de collecte et qui renseignent sur celui-ci.Dans le cadre de cet atelier, nous proposons une première partie théorique sur les métadonnées et paradonnées, suivie d’une partie “prise en main” où nous étudierons de plus près les outils et procédures permettant le traitement des métadonnées et paradonnées. Le déroulé de l’atelier de deux heures serait :Métadonnées : grands principes, présentation du standard DDI, utilisé au CDSPParadonnées : définitions, cas d’usageOutils et pratiques de documentation de données d’enquêtes selon les principes FAIR> Démonstration des pratiques d’édition, de stockage et de diffusion des métadonnées du CDSP se basant sur les spécifications DDI Lifecycle avec la suite logicielle Colectica. > Pratiques documentaires et standards applicables aux enquêtes qualitatives (plan de classement, DC, DDI, EAD)Traitement des données pour leur diffusion (anonymisation, recodages, formats pérennes, etc)Exploitation des paradonnées [1] Wallis JC, Rolando E, Borgman CL (2013) If We Share Data, Will Anyone Use Them? Data Sharing and Reuse in the Long Tail of Science and Technology. PLoS ONE 8(7): e67332. https://doi.org/10.1371/journal.pone.0067332

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Exporter en