26 août 2014
info:eu-repo/semantics/OpenAccess
Mejdi Slim, « Dictée automatique de textes à haute voix : analyse de corpus et modélisation des stratégies d'énonciation », DUMAS - Dépôt Universitaire de Mémoires Après Soutenance, ID : 10670/1.01j2p8
Les travaux présentés dans ce mémoire se situent dans le cadre de la synthèse de la parole à partir du texte. Notre travail vise à concevoir un système permettant de dicter automatiquement à voix haute un texte orthographié à des élèves de niveau CM1-CM2. Ce système comporte quatre modules : 1) un module d'analyse morphosyntaxique qui lève une structure arborescente à partir de la chaîne orthographique ; 2) un module de marquage prosodique qui découpe cet énoncé en groupes prosodiques et les articule entre eux ; 3) un module de génération de prosodie qui calcule automatiquement la prosodie (contour de fréquence fondamentale et contour rythmique) à appliquer sur ces groupes en fonction des diverses marques ; 4) un module de synthèse qui convertit l'ensemble de ces données segmentales et suprasegmentales en signal acoustique. Partant de la sortie d'un analyseur syntaxique à l'état de l'art, notre travail a consisté tout d'abord à projeter toute ou partie de la structure syntaxique de chaque texte afin de marquer le texte et les reprises de ses groupes de mots par un ensemble restreint de marqueurs. Nous avons ensuite paramétré un modèle de génération de la prosodie SFC "Superposition of Functional Contours" développé par Bailly et Holm (2003) à l'aide du corpus de dictées. Nous avons finalement évalué la qualité de la synthèse produite par un système de synthèse disponible au GIPSA-Lab. Nous montrons que les générateurs de contours indexés par la version d'énonciation arrivent à capturer le ralentissement du débit, l'accentuation du découpage des mots et des syntagmes ainsi que les modifications des contours mélodiques des quatre versions de chaque groupe de mots.