2022
Ce document est lié à :
info:eu-repo/semantics/altIdentifier/doi/10.5281/zenodo.7378308
https://www.gnu.org/licenses/agpl.txt , info:eu-repo/semantics/OpenAccess
Benjamin Ooghe-Tabanou et al., « Hyphe: web corpus curation tool & links crawler », Archive ouverte de Sciences Po (SPIRE), ID : 10.5281/zenodo.7378308
Hyphe est un logiciel libre de type "crawler web" permettant aux chercheurs de créer des corpus constitués de pages web et de liens entre elles sur un sujet spécifique.Ces pages web sont sélectionnées par les chercheurs et peuvent être regroupées en « webentités », qui peuvent être des pages individuelles, des sites web, des sous-domaines ou même une combinaison de ceux-ci. Ces entités représentent différents acteurs de la problématique à traiter (par exemple, une personne, une organisation, etc.).En les crawlant, Hyphe permet de construire itérativement et de visualiser un réseau des relations entre ces acteurs à travers les hyperliens reliant ces webentités.De nouvelles webentités sont automatiquement suggérées en explorant les hyperliens de chaque entité présente dans le corpus. Les chercheurs peuvent ensuite les examiner dans un processus itératif et qualitatif.Hyphe permet aux chercheurs de choisir et de catégoriser manuellement les acteurs qu'ils souhaitent ajouter à leur corpus. À ce titre, il doit être considéré comme un outil quali-quantitatif.