SynPaFlex-Corpus

Fiche du document

Date

17 octobre 2022

Discipline
Type de document
Langue
Identifiant
  • 11403/SYNPAFLEX-CORPUS
Source

ORTOLANG

Collection

Ortolang

Organisation

Équipex ORTOLANG

Licences

free_for_non_commercial_use , Libre sans utilisation commerciale , Free for non commercial use , Licence Creative Commons Attribution - Pas d'Utilisation Commerciale - Partage dans les Mêmes Conditions 2.0 Générique




Citer ce document

Aghilas Mr Sini et al., « SynPaFlex-Corpus », ORTOLANG


Partage / Export

Résumé Fr En

SynPaFlex est un corpus de livres-audios en français composé de 87 heures de parole de bonne qualité, enregistré par une unique locutrice. Il est constitué d’un ensemble de livres de différents genres. Ce corpus diffère des corpus existants, constitués généralement de quelques heures de parole mono-genre et multi-locuteurs. La motivation principale pour construire un tel corpus est l’exploration de l’expressivité à travers différents points de vue, tels que le style de discours, la prosodie, la prononciation, et en utilisant différents niveaux d’analyse (syllabe, mot prosodique ou lexical, groupe syntaxique ou prosodique, phrase, paragraphe). Cela permettra de développer des modèles autorisant un meilleur contrôle de l’expressivité en synthèse de parole, ou d’adapter la prononciation et la prosodie au type de discours (changement dans la perspective du discours, style direct/indirect, etc.). A cette fin, le corpus a été annoté automatiquement et fournit des informations telles que les labels et frontières de phones, les syllabes, les mots et les étiquettes morpho-syntaxiques. De plus, une part significative du corpus a été annoté manuellement pour encoder le style direct/indirect et des informations d’ordre émotionnel.

SynPaFlex is a corpus of audiobooks in French composed of 87 hours of good quality speech recorded by a single speaker. It consists of a set of books of different genres. This corpus differs from the existing corpora, generally made up of a few hours of single-genre and multi-speaker speech. The primary motivation for building such a corpus is the exploration of expressivity through different points of view, such as the style of speech, prosody, pronunciation, and using different analysis (syllable, prosodic or lexical word, syntactic or prosodic group, sentence, paragraph). These features will make it possible to develop models allowing better control of expressivity in speech synthesis or to adapt pronunciation and prosody to the type of speech (change in the perspective of the speech, direct/indirect style). To this end, the corpus has been automatically annotated and provides information such as phone labels and borders, syllables, words, and morpho-syntactic labels. A significant part of the corpus has been manually annotated to encode direct/indirect style and emotional information.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en