Plugging a neural phoneme recognizer into a simple language model: a workflow for low-resource settings

Séverine Guillaume; Guillaume Wisniewski; Benjamin Galliot; Minh-Châu Nguyễn; Maxime Fily; Guillaume Jacques; Alexis Michaud

Plugging a neural phoneme recognizer into a simple language model: a workflow for low-resource settings Intégration d'un système de reconnaissance neuronale des phonèmes et d'un modèle de langue simple : une chaîne de traitement pour les scénarios à faibles ressources En Fr

Fiche du document

Auteurs

Date

18 septembre 2022

Discipline

Linguistique

Type de document

Colloques et conférences

Périmètre

Publications

Langue

Anglais

Identifiants

Source

HAL-SHS : linguistique

Relations

Ce document est lié à :
info:eu-repo/semantics/altIdentifier/doi/10.21437/Interspeech.2022-11314

Collection

Archives ouvertes

Organisation

Centre pour la communication scientifique directe

Licences

http://creativecommons.org/licenses/by-nc-sa/ , info:eu-repo/semantics/OpenAccess

Mots-clés En Fr

Interdisciplinarité Reconnaissance automatique de la parole Interaction homme-machine Documentation computationnelle des langues

Sujets proches En

Language (New words, slang, etc.)

Citer ce document

Séverine Guillaume et al., « Intégration d'un système de reconnaissance neuronale des phonèmes et d'un modèle de langue simple : une chaîne de traitement pour les scénarios à faibles ressources », HAL-SHS : linguistique, ID : 10.21437/Interspeech.2022-11314

Partage / Export

Résumé En Fr

Des travaux récents montrent que la spécialisation (*fine-tuning*) d'un modèle multilingue de représentation de la parole (tel que XLS-R) au moyen de très petites quantités de données annotées permet d'obtenir des systèmes de transcription phonémique de qualité suffisante pour être utile aux linguistes de terrain dans leur entreprise de documentation des langues du monde. Dans ce travail, nous exposons une méthode très simple qui permet d'améliorer la qualité de ces systèmes : leur intégration avec un modèle de langue. Nos expériences sur une langue menacée, le japhug (famille trans-himalayenne/tibéto-birmane), montrent que cette approche peut réduire significativement le taux d'erreur sur les mots (WER: *Word Error Rate*), et mener au stade de la reconnaissance automatique de mots entiers.

Plugging a neural phoneme recognizer into a simple language model: a workflow for low-resource settings Intégration d'un système de reconnaissance neuronale des phonèmes et d'un modèle de langue simple : une chaîne de traitement pour les scénarios à faibles ressources En Fr

Fiche du document

Mots-clés En Fr

Sujets proches En

Citer ce document

Métriques

Partage / Export

Résumé En Fr

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en