Automatisation d’un processus de contrôle qualité de données au format tableur issues de Prodinra

Fiche du document

Date

2019

Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licences

http://creativecommons.org/licenses/by-sa/ , info:eu-repo/semantics/OpenAccess


Résumé En Fr

The INRA professionals of Technical and Scientific Information (IST) look after the quality of dataavailable in the open repository ProdInra. This work allows obtaining some lists and indicators the most reliablepossible about the publications. In this scope, we work together with a computer expert on the automatization toset up an automatized quality control process based on a extracted excel file, which would be more efficient. Thispaper describes the process in detail, so this process could be reused for anyone who works with a corpus ofpublications in ProdInra. You will find as well some precautionary advices and cares about the files that are usedin the process. We propose then possible evolutions for the future ProdInra when migrated in the HAL infrastructure.

Les professionnels de l’Information Scientifique et Technique (IST), de l’Inra veillent à ce que les données disponibles dans l’archive ouverte ProdInra soient de qualité. Ce travail est indispensable pour l’obtention de listes de publications et d’indicateurs les plus fiables possible. Dans ce cadre, nous avons travaillé en collaboration avec un informaticien sur une automatisation d’un processus de contrôle qualité de données extraites au format tableur pour gagner en efficacité. Cet article décrit notre démarche. Il vous propose de faire de même pour votre corpus bibliographique issu de ProdInra. Vous trouverez également des conseils sur les précautions à prendre pour utiliser les fichiers de sortie. Enfin, nous proposons des évolutions en prévision du passage de ProdInra à HaL.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en