19 juillet 2014
Ce document est lié à :
info:eu-repo/semantics/altIdentifier/doi/10.1051/shsconf/20140801344
info:eu-repo/semantics/OpenAccess
Yves Laprie et al., « Comment faire parler les images aux rayons X du conduit vocal ? », HAL-SHS : linguistique, ID : 10.1051/shsconf/20140801344
La production de la parole est un phénomène dynamique qui repose sur la réalisation de gestes articulatoires par le locuteur. Son étude nécessite donc des moyens d'acquisition, souvent issus de l'imagerie médicale comme c'est le cas avec l'imagerie par rayons X qui a été utilisée pour construire des bases de données jusqu'à la fin du siècle dernier. Ces données se présentent sous la forme de cinéradiographies qui requièrent un dépouillement préalable à leur exploitation. Le logiciel Xarticulators a été développé à cette fin et il permet notamment d'extraire manuellement ou automatiquement les contours des articulateurs. Cette communication présente la constitution des bases de données de l'IPS, le protocole de dépouillement et la construction de modèles articulatoires destinés à approcher la forme du conduit vocal pour les voyelles et les consonnes. Nous détaillons en particulier l'amélioration du modèle dans le cas consonnes pour qu'il puisse être précis au point d'articulation et donner une acoustique correcte lors de la synthèse. Cette communication se termine avec la présentation des outils de synthèse articulatoire par copie qui permettent de synthétiser de la parole réaliste à partir des images d'un film aux rayons X du conduit vocal.