Towards a Unified ASR System for the Armenian Standards

Fiche du document

Date

20 juin 2022

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licences

http://creativecommons.org/licenses/by-nc/ , info:eu-repo/semantics/OpenAccess




Citer ce document

Samuel Chakmakjian et al., « Towards a Unified ASR System for the Armenian Standards », HAL-SHS : linguistique, ID : 10670/1.xf45ay


Métriques


Partage / Export

Résumé En Fr

Armenian is a traditionally under-resourced language, which has seen a recent uptick in interest in the development of its tools and presence in the digital domain. Some of this recent interest has centred around the development of Automatic Speech Recognition (ASR) technologies. However, the language boasts two standard variants which diverge on multiple typological and structural levels. In this work, we examine some of the available bodies of data for ASR construction, present the challenges in the processing of these data and propose a methodology going forward.

L'arménien est une langue traditionnellement peu dotée, qui a connu récemment un regain d'intérêt pour le développement de ses outils et de sa présence dans le domaine numérique. Une partie de cet intérêt récent s'est concentrée sur le développement de technologies de reconnaissance automatique de la parole (ASR). Cependant, la langue comprend deux variantes standard qui divergent à de nombreux niveaux typologiques et structurels. Dans ce travail, nous examinons certains des corpus de données disponibles pour la construction d'un système de reconnaissanceautomatique de la parole, nous présentons les défis posés par le traitement de ces données et nous proposons une méthodologie pour les étapes ultérieures.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en