20 juin 2022
http://creativecommons.org/licenses/by-nc/ , info:eu-repo/semantics/OpenAccess
Samuel Chakmakjian et al., « Towards a Unified ASR System for the Armenian Standards », HAL-SHS : linguistique, ID : 10670/1.xf45ay
L'arménien est une langue traditionnellement peu dotée, qui a connu récemment un regain d'intérêt pour le développement de ses outils et de sa présence dans le domaine numérique. Une partie de cet intérêt récent s'est concentrée sur le développement de technologies de reconnaissance automatique de la parole (ASR). Cependant, la langue comprend deux variantes standard qui divergent à de nombreux niveaux typologiques et structurels. Dans ce travail, nous examinons certains des corpus de données disponibles pour la construction d'un système de reconnaissanceautomatique de la parole, nous présentons les défis posés par le traitement de ces données et nous proposons une méthodologie pour les étapes ultérieures.