Procédures de désambiguïsation pour les systèmes de recherche d’information

Fiche du document

Date

2003

Discipline
Type de document
Périmètre
Langue
Identifiant
Relations

Ce document est lié à :
Revue québécoise de linguistique ; vol. 32 no. 1 (2003)

Collection

Erudit

Organisation

Consortium Érudit

Licence

Tous droits réservés © Revue québécoise de linguistique, 2003



Citer ce document

Pierre-André Buvet et al., « Procédures de désambiguïsation pour les systèmes de recherche d’information », Revue québécoise de linguistique, ID : 10.7202/012249ar


Métriques


Partage / Export

Résumé Fr En

Nous discutons de la nécessité de tenir compte de la polysémie nominale pour les systèmes de recherche d’information qui tiennent compte du contenu des textes numérisés. Nous présentons un prototype qui fonctionne en identifiant les substantifs d’un texte donné et en stipulant les domaines qui leur sont rattachés afin de faire ressortir une dominante, et ainsi de procéder au typage du texte en termes de domaine. Ce prototype a pour principale particularité d’utiliser le système intex et de faire appel aux descriptions formalisées du français effectuées au Laboratoire de Linguistique Informatique implémentées sous forme de dictionnaires électroniques et de grammaires locales. Nous montrons comment intex, en s’appuyant sur ces dictionnaires et ces grammaires, peut lever des ambiguïtés relatives à des substantifs.

We show how nouns ambiguity affects the quality of Information Extraction systems. We present the iris prototype, which identifies nouns in a text, associates each of them with one or more semantic domains, resolves domain ambiguities, and produces a resulting domain that characterizes the text. This prototype is built with intex, and uses the linguistic resources of the Laboratoire de Linguistique Informatique, implemented in the form of electronic dictionaries for classes of predicates and arguments, and local grammars. We show how intex can be used to integrate and process these resources, and how the resulting system can disambiguate nouns.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en