11 février 2022
Ce document est lié à :
info:eu-repo/semantics/altIdentifier/arxiv/2202.05682
info:eu-repo/semantics/OpenAccess
Ange Richard et al., « GenderedNews: Une approche computationnelle des écarts de représentation des genres dans la presse française », HAL-SHS : sociologie, ID : 10670/1.9wlj2u
Nous présentons dans cet article GenderedNews (https://gendered-news.imag.fr), un tableau de bord en lignepermettant de mesurer les écarts de représentation des genres dans la presse française en ligne. Nous utilisons desméthodes automatiques du traitement automatique des langues (TAL) pour quantifier les inégalités de genre dans lesmédias, en complémentarité des projets de grande envergure tels que le Global Media Monitoring Projet. Ces études ontmis en lumière le déséquilibre de genres dans les médias et l’inertie de son évolution. Cependant, leur échantillonnageet leur coût en termes de temps, de données et de main-d’œuvre restent des limites à leur généralisation. L’approcheautomatique nous permet de proposer des mesures complémentaires pour quantifier les inégalités de genre dans lesreprésentations médiatiques. Nous entendons la notion de représentation comme la présence et la distribution deshommes et des femmes mentionnés ·es et cité·es dans les médias – et non la représentation au sens de stéréotypisation.Dans cet article, nous commençons par faire une revue des différentes manières utilisées dans la littérature étudiantles écarts de genre dans les médias : l’analyse de contenu qualitative, l’analyse de contenu quantitative, et l’analysecomputationnelle de contenu (text mining). Nous détaillons ensuite les méthodes adoptées pour GenderedNews et lesdeux mesures que nous avons implémentées : le taux de masculinité des mentions et la proportion des hommes cités.Nous décrivons les données que nous collectons tous les jours (les articles de sept des titres principaux de la pressed’information en ligne française), la méthodologie de nos mesures, ainsi que quelques visualisations du tableau de bord.Nous terminons en proposant une observation plus poussée d’un échantillon de deux mois de notre base de données.