Enriching a Text by Semantic Disambiguation for Information Extraction

Fiche du document

Date

27 mai 2002

Discipline
Type de document
Périmètre
Langue
Identifiants
Relations

Ce document est lié à :
info:eu-repo/semantics/altIdentifier/arxiv/cs.IR/0506048

Collection

Archives ouvertes

Licences

http://creativecommons.org/licenses/by-nc-sa/ , info:eu-repo/semantics/OpenAccess




Citer ce document

Bernard Jacquemin et al., « Enriching a Text by Semantic Disambiguation for Information Extraction », HAL-SHS : linguistique, ID : 10670/1.sarjjl


Métriques


Partage / Export

Résumé En Fr

External linguistic resources have been used for a very long time in information extraction. These methods enrich a document with data that are semantically equivalent, in order to improve recall. For instance, some of these methods use synonym dictionaries. These dictionaries enrich a sentence with words that have a similar meaning. However, these methods present some serious drawbacks, since words are usually synonyms only in restricted contexts. The method we propose here consists of using word sense disambiguation rules (WSD) to restrict the selection of synonyms to only these that match a specific syntactico-semantic context. We show how WSD rules are built and how information extraction techniques can benefit from the application of these rules.

Des ressources linguistiques externes ont été exploitées depuis longtemps en extration d'information. Ces méthodes enrichissent un document en y ajoutant des données sémantiquement équivalentes aux informations originales, afin d'améliorer le rappel. Par exemple, certaines de ces approches exploitent des dictionnaires de synonymes pour ajouter aux phrases des mots de signification proche. Cependant, cette technique présente certains désavantages, car ces mots sont habituellement synonymes seulement dans certains contextes. Nous proposons une méthodologie qui utilise un système de désambiguïsation sémantique pour restreindre la sélection des synonymes et conserver seulement ceux qui correspondent au contexte syntaxico-sémantique. Nous montrons comment les règles de désambiguïsation sémantiques sont construites et dans quelle mesure les techniques d'extraction d'information peuvent profiter de l'application de ces règles.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en