Testing pre-trained models on un(der-)described languages: Automatic Speech Recognition experiments on the Japhug language

Documentation computationnelle des langues Reconnaissance automatique de la parole Science ouverte Apprentissage machine Linguistique de terrain Japhug

Sujets proches En Fr

Romanisation (transcription) Transcription (linguistique) Graphie

Citer ce document

Séverine Guillaume et al., « Les modèles pré-entraînés à l'épreuve des langues rares : expériences de reconnaissance de mots sur la langue japhug (sino-tibétain) », HAL-SHS : linguistique, ID : 10.21437/JEP.2022-52

Partage / Export

Résumé En Fr

Nous décrivons dans ce travail des résultats obtenus dans le cadre d'explorations interdisciplinaires visant à venir en appui aux linguistes « de terrain » au moyen d'outils de Reconnaissance Automatique de la Parole. Spécifiquement, nous nous focalisons sur le développement d'un système de reconnaissance de la parole pour le japhug, langue rare de Chine. L'objectif consiste à réduire l'effort de transcription des linguistes « de terrain ». Nous montrons comment une nouvelle approche neuronale fondée sur la spécialisation d'un modèle de représentation générique pré-entraîné multilingue XLS-R reposant sur une architecture de type Transformer permet d'améliorer significativement la qualité de la transcription phonémique dans le cas où seules quelques heures de données annotées sont disponibles, et surtout de progresser jusqu'à la reconnaissance automatique de mots. Nous relevons néanmoins des difficultés de mise en oeuvre, en termes de stabilité de l'apprentissage. La question de l'évaluation de l'outil par les linguistes de terrain est également abordée.

Testing pre-trained models on un(der-)described languages: Automatic Speech Recognition experiments on the Japhug language Les modèles pré-entraînés à l'épreuve des langues rares : expériences de reconnaissance de mots sur la langue japhug (sino-tibétain) En Fr

Fiche du document

Mots-clés En Fr

Sujets proches En Fr

Citer ce document

Métriques

Partage / Export

Résumé En Fr

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en