Phonolette: a grapheme-to-phoneme converter for French

Fiche du document

Date

15 décembre 2023

Discipline
Type de document
Périmètre
Langue
Identifiants
Relations

Ce document est lié à :
info:eu-repo/semantics/reference/issn/2804-7397

Collection

Peren-Revues

Organisation

Université de Lille

Licences

CC BY , info:eu-repo/semantics/openAccess




Citer ce document

Basilio Calderone et al., « Phonolette: a grapheme-to-phoneme converter for French », Lexique : revue en sciences du langage, ID : 10.54563/lexique.1129


Métriques


Partage / Export

Résumé Fr En

L’article présente Phonolette, un phonologiseur du français, capable de prédire une transcription phonologique d’un mot à partir de sa représentation orthographique. Phonolette est basé sur une architecture LSTM bidirectionnelle. Le protocole d’apprentissage de Phonolette combine les formes orthographiques du lexique GLÀFF et les transcriptions phonologiques de Flexique. Deux jeux de données ont été utilisés : l’intersection des entrées de GLÀFF et de Flexique ; la même intersection, mais en conservant seulement les formes qui ont une graphotactique française. Les résultats obtenus sont prometteurs. La précision est de 97,82 % sur le jeu complet et de 98,11 % sur le jeu réduit.

This paper presents Phonolette, a phonologizer for the French language, capable of predicting a phonological transcription of a word from its orthographic representation. Phonolette is based on a bidirectional LSTM architecture. The training protocol of Phonolette combines orthographic forms from the GLÀFF lexicon and phonological transcriptions from Flexique. Two datasets were used: the intersection of GLÀFF and Flexique entries; and the same intersection, but keeping only those forms with French graphotactics. The results are promising. Accuracy is 97.82% for the full dataset and 98.11% for the reduced dataset.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines