14 septembre 2015
info:eu-repo/semantics/OpenAccess
Camille Lecorgne, « Validation d'un processus de création de voix contextuelle et intégration de nouvelles langues à une application de synthèse vocale grand public », Dépôt Universitaire de Mémoires Après Soutenance, ID : 10670/1.i6xdru
Les technologies vocales se développant toujours plus dans notre environnement, la recherche de la qualité et du naturel sont devenus les enjeux majeurs de la synthèse vocale. Ce mémoire met donc en évidence les techniques développées par Voxygen pour garantir une synthèse de qualité, naturelle et expressive : l'utilisation d'une unité particulière ; le sandwich, et la création de voix contextuelles (Slot'N'Fill). Il appuie également sur l'application des ces technologies à des langues diverses. Ce travail fait suite à un stage de six mois effectué chez Voxygen durant lequel un processus de création de voix contextuelles a été validé sur deux langues et au cours duquel de nouvelles langues ont été intégrées à une application de synthèse vocale grand public. Les deux missions confiées ont été réalisées dans l'optique de fabriquer une synthèse de qualité, selon des procédés différents. Ce travail présente donc l'importance de l'utilisation du sandwich et l'impact du choix des corpus dans la création de voix naturelles et expressives. Le stage ayant permis de prendre part à toutes les étapes des processus de création de voix dans des langues diverses, nous avons choisi de présenter ces différentes phases sous les notions de plurilinguisme et de pluridisciplinarité.