Introduction aux techniques open source d’extraction de contenus de pages Web et premières analyses textuelles

Fiche du document

Date

17 janvier 2022

Type de document
Périmètre
Langue
Identifiant
Licence

info:eu-repo/semantics/openAccess



Citer ce document

Léo Henry et al., « Introduction aux techniques open source d’extraction de contenus de pages Web et premières analyses textuelles », Archined : l'archive ouverte de l'INED, ID : 10670/1.c28949...


Métriques


Partage / Export

Résumé 0

Nous présenterons les méthodes de scraping en trois parties. D’abord nous expliquerons de ce qu’il s’agit et des limites théoriques, éthiques et légales à son utilisation. Puis dans un second temps, nous présenterons les différents outils et leur avantage, ainsi qu’un exemple pratique et en direct de scraping sur le site de la revue population. Enfin, nous montrerons une manière d’utiliser ces données par l’analyse textuelle

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets