Comment faire parler les images aux rayons X du conduit vocal ?

Fiche du document

Date

19 juillet 2014

Discipline
Type de document
Périmètre
Langue
Identifiants
Relations

Ce document est lié à :
info:eu-repo/semantics/altIdentifier/doi/10.1051/shsconf/20140801344

Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess




Citer ce document

Yves Laprie et al., « Comment faire parler les images aux rayons X du conduit vocal ? », HAL-SHS : linguistique, ID : 10.1051/shsconf/20140801344


Métriques


Partage / Export

Résumé En Fr

Speech production is a dynamic process which relies on the realization of articulatory gestures by the speaker. Its study thus necessitates technologies to acquire articulatory data, which often come from medical imaging. Xrays have been used until the end of last century. These data are films which require processing before being exploited. Xarticulators software was developed for this purpose and it enables the manual or automatic extraction of articulator contours. This communication presents the database collected at IPS, the protocol used to process data and the construction of articulatory models intended to approximate the vocal tract shape for vowels and consonants. We detail the improvement of the model in the cases of consonants so as to offer a good geometric precision at the place of articulation, and thus a correct acoustic signal with articulatory synthesis. This communications ends with the presentation of articulatory copy synthesis tools which enable realistic speech to be synthesized from images of an Xray film of the vocal tract.

La production de la parole est un phénomène dynamique qui repose sur la réalisation de gestes articulatoires par le locuteur. Son étude nécessite donc des moyens d'acquisition, souvent issus de l'imagerie médicale comme c'est le cas avec l'imagerie par rayons X qui a été utilisée pour construire des bases de données jusqu'à la fin du siècle dernier. Ces données se présentent sous la forme de cinéradiographies qui requièrent un dépouillement préalable à leur exploitation. Le logiciel Xarticulators a été développé à cette fin et il permet notamment d'extraire manuellement ou automatiquement les contours des articulateurs. Cette communication présente la constitution des bases de données de l'IPS, le protocole de dépouillement et la construction de modèles articulatoires destinés à approcher la forme du conduit vocal pour les voyelles et les consonnes. Nous détaillons en particulier l'amélioration du modèle dans le cas consonnes pour qu'il puisse être précis au point d'articulation et donner une acoustique correcte lors de la synthèse. Cette communication se termine avec la présentation des outils de synthèse articulatoire par copie qui permettent de synthétiser de la parole réaliste à partir des images d'un film aux rayons X du conduit vocal.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en