Répartition hommes/femmes dans les systèmes d’IA : une étude pilote sur les grands corpus pour la transcription automatique de la parole

Fiche du document

Date

29 mai 2018

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess



Sujets proches Fr

Percussion (mécanique)

Citer ce document

Mahault Garnerin, « Répartition hommes/femmes dans les systèmes d’IA : une étude pilote sur les grands corpus pour la transcription automatique de la parole », DUMAS - Dépôt Universitaire de Mémoires Après Soutenance, ID : 10670/1.en3gnb


Métriques


Partage / Export

Résumé En Fr

AI systems are trained on a huge amount of data, and speech processing technologies are no exception to the rule. However corpora may be statistically imbalanced regarding genders and this can lead to discriminative algorithms. With AI becoming ever more present in our everyday life, it seems more than necessary to be aware of the impact of gender representation in training data on the system’s performances.This masters’ thesis proposes to study gender representation in large spoken french corpora and to estimate the impact of this distribution on the performances of an automatic speech recognition system.

Les systèmes d’IA sont développés sur des grands corpus de données et les technologies du traitement automatique de la parole n’échappent pas à cette règle. Mais ces grands corpus de données peuvent contenir des répartitions de genre non-équilibrées qui peuvent conduire au développement d’algorithmes discriminants. Les systèmes d’IA infiltrant de plus en plus notre quotidien, et la voix s’imposant comme la nouvelle interface homme/machine, il devient nécessaire de pouvoir étudier et quantifier l’impact de la répartition homme/femme dans les données d’apprentissage sur les performances des systèmes.Ce mémoire propose donc dans un premier temps d’étudier la répartition des genres dans les grands corpus du français oral, et dans un second temps, d’évaluer l’impact de cette représentation sur les performances d’un système de reconnaissance automatique de la parole.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en