Achile : a system based on parallel-distributed processes for speaker-independent acoustic-phonetic decoding and word recognition Achile : un dispositif de décodage acoustico-phonétique et d'identification lexicale indépendant du locuteur à partir de modules mixtes En Fr

Fiche du document

Auteur
Date

21 novembre 1997

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess




Citer ce document

Alain Ghio, « Achile : un dispositif de décodage acoustico-phonétique et d'identification lexicale indépendant du locuteur à partir de modules mixtes », HAL-SHS : linguistique, ID : 10670/1.0yis3k


Métriques


Partage / Export

Résumé En Fr

The aim of Speech Recognition is to identify with machines what a speaker is saying. This process can recognise sounds (acoustic-phonetic decoding), words (isolated-words recognition) or sentences. Engineers can build such a system only for a specified user or for different speakers. ACHILE is a system based on parallel-distributed processes for speaker-independent acoustic-phonetic decoding and words recognition. This is a speaker-independent isolated-words recognition system without learning and adaptation stage. We aim to examine to what extent a knowledge-based model can recognise segmental structure without stochastic modelling. The system proposed is inspired, in a functional way, by some features of human cognitive processing. This system is composed of a succession of demons who work on the pattern, each performing a different job. The speech signal first arrives at the low level analysis processes. A part of this analysis is realised with a spectral detection based on a perceptual model including frequencies weighting and critical bands analysis. Low-level detectors activate parallel distributed processes of decoding (segmentation, global and analytic recognition). Their results, then, are sent to the high-level processes, who act upon them using high level information (phonological rules, access to a dictionary...). Finally, a decision process selects the alternative that has the strongest evidence. The system has been tested on 500 words. It allows us to quantify the relevance of knowledge, analysis and algorithms used. It is also possible to change or add some parts which is important to improve the system.

La reconnaissance de la parole est une activite dont le but est de faire identifier, par des machines, ce qui est dit par une personne. Le processus peut consister a reconnaitre des sons (decodage acoustico-phonetique), des mots (identification lexicale) ou des phrases. Un tel systeme est soit concu pour un seul utilisateur, soit pour differents locuteurs. Achile est un dispositif de decodage acoustico-phonetique et d'identification lexicle. Il permet la reconnaissance de mots isoles independamment du locuteur sans phase d'apprentissage, ni d'adaptation. Notre objectif est d'examiner jusqu'a quel point un modele a base de connaissances phonetiques est capable de decoder de facon automatique la structure phonique de la parole sans recourir aux methodes stochastiques. Le dispositif s'inspire, d'un point de vue fonctionnel, du traitement cognitif humain. La tache de reconnaissance est effectuee par repartition du travail et interaction d'une societe d'experts. Le signal de parole alimente tout d'abord les analyseurs de bas niveau. Pour cela, est utilisee, entre autre, une analyse spectrale fondee sur modele auditif qui tient compte de la notion de ponderation sonique et de bandes critiques. Les processus de bas-niveau transmettent leurs donnees a plusieurs modules de decodage fonctionnant en parallele (segmentation, reconnaissance globale et analytique). Les resultats sont ensuite transmis aux modules de haut-niveau qui agissent en utilisant des connaissances symboliques (representations phonologiques, acces lexical). Un moteur d'inferences se charge de prendre une decision finale en comparant les donnees d'un dictionnaire aux donnees decodees. L'evaluation du dispositif sur un lexique de 500 mots nous permet de quantifier la pertinence des connaissances, des analyses et des algorithmes employes. C'est aussi le moyen de pouvoir faire evoluer le dispositif en apportant des modifications.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en