17 janvier 2022
info:eu-repo/semantics/openAccess
Léo Henry et al., « Introduction aux techniques open source d’extraction de contenus de pages Web et premières analyses textuelles », Archined : l'archive ouverte de l'INED, ID : 10670/1.c28949...
Nous présenterons les méthodes de scraping en trois parties. D’abord nous expliquerons de ce qu’il s’agit et des limites théoriques, éthiques et légales à son utilisation. Puis dans un second temps, nous présenterons les différents outils et leur avantage, ainsi qu’un exemple pratique et en direct de scraping sur le site de la revue population. Enfin, nous montrerons une manière d’utiliser ces données par l’analyse textuelle