19 mars 2019
Ce document est lié à :
info:eu-repo/semantics/reference/issn/0761-9081
Ce document est lié à :
info:eu-repo/semantics/reference/issn/2650-8176
All rights reserved , info:eu-repo/semantics/openAccess
Lyndon Rey et al., « Automatic Documentation of Faetar’s [i]: A Methodology for Discovering Vowel Space Using Artificial Neural Networks », Géolinguistique, ID : 10.4000/geolinguistique.306
Considérez un corpus de discours énorme et non étiqueté d’une langue sans tradition écrite. Comment mesurer rapidement et précisément l’espace des voyelles, sans trop dépenser de temps et de fonds ? Nous présentons une méthode pour établir la variation à travers de grands corpus de langage parlé naturel, particulièrement utiles pour les langues moins documentées. Par une fonction heuristique, l’échantillon de voyelle optimal pour une catégorie de phone donnée peut être trouvé. Cette heuristique est formée par l’apprentissage automatique, un réseau neuronal non supervisé. Ce processus nous permet de tester de grandes quantités de données brutes sans marquer manuellement des heures d’enregistrements. Notre objectif est de modéliser la manière dont parlent les locuteurs de différents dialectes : quels sont les modèles phonétiques qu’ils sont le plus susceptibles de montrer et pouvons-nous différencier et classer les échantillons inconnus à l’aide de ces modèles créés à partir du langage naturel ? Ce travail utilise des données vocales spontanées du dialecte de Faeto (le faetar), une langue en danger de disparition.