Recherche par le contenu dans des documents audiovisuels multilingues

Résumé Fr En

Nous présentons dans cet article une approche basée sur l’utilisation de l’alphabet phonétique international (API) pour l’indexation et la recherche par le contenu de documents audiovisuels multilingues. Elle a été validée lors de la compétition « Star Challenge » sur les moteurs de recherche organisée par l’Agence A*STAR de Singapour. Elle comprend la construction d’un modèle acoustique multilingue basé sur l’API et une méthode basée sur la programmation dynamique pour la recherche de segments de documents par « détection de chaînes API ». Les méthodes que nous avons développées ont obtenu de très bons résultats sur l’ensemble des tâches du challenge.

We present in this paper an approach based on the use of the International Phonetic Alphabet (IPA) for content-based indexing and retrieval of multilingual audiovisual documents. It has been validated within the “Star Challenge” search engine competition organized by the A*STAR Agency of Singapore. It includes the building of an IPA-based multilingual acoustic model and a dynamic programming based method for searching document segments by “IPA string spotting”. The methods that we have developed have obtained very good results on all the tasks of the challenge.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en