1 juillet 2019
info:eu-repo/semantics/OpenAccess
Patricia Chiril et al., « Multilingual and Multitarget Hate Speech Detection in Tweets », HAL SHS (Sciences de l’Homme et de la Société), ID : 10670/1.01697a...
Les réseaux sociaux sont un espace où les utilisateurs sont libres d’exprimer leurs opinions ce qui donne lieu à la diffusion de messages haineux ou insultants qui doivent être modérés. Nous proposons dans cet article une approche supervisée pour la détection automatique de message haineux dans une perspective multilingue. Nous nous intéressons en particulier à la haine exprimée à l’encontre de deux types de cibles (des immigrants et des femmes) dans des tweets en anglais, ainsi qu’aux messages sexistes dans des tweets en anglais et en français. Divers modèles d’apprentissage automatique ont été développés, allant de modèles à base de traits, à des approches neuronales. Nos expérimentations montrent des résultats encourageants pour les deux langues.