29 mai 2018
info:eu-repo/semantics/OpenAccess
Mahault Garnerin, « Répartition hommes/femmes dans les systèmes d’IA : une étude pilote sur les grands corpus pour la transcription automatique de la parole », DUMAS - Dépôt Universitaire de Mémoires Après Soutenance, ID : 10670/1.en3gnb
Les systèmes d’IA sont développés sur des grands corpus de données et les technologies du traitement automatique de la parole n’échappent pas à cette règle. Mais ces grands corpus de données peuvent contenir des répartitions de genre non-équilibrées qui peuvent conduire au développement d’algorithmes discriminants. Les systèmes d’IA infiltrant de plus en plus notre quotidien, et la voix s’imposant comme la nouvelle interface homme/machine, il devient nécessaire de pouvoir étudier et quantifier l’impact de la répartition homme/femme dans les données d’apprentissage sur les performances des systèmes.Ce mémoire propose donc dans un premier temps d’étudier la répartition des genres dans les grands corpus du français oral, et dans un second temps, d’évaluer l’impact de cette représentation sur les performances d’un système de reconnaissance automatique de la parole.