27 mai 2002
Ce document est lié à :
info:eu-repo/semantics/altIdentifier/arxiv/cs.IR/0506048
http://creativecommons.org/licenses/by-nc-sa/ , info:eu-repo/semantics/OpenAccess
Bernard Jacquemin et al., « Enriching a Text by Semantic Disambiguation for Information Extraction », HAL-SHS : linguistique, ID : 10670/1.sarjjl
Des ressources linguistiques externes ont été exploitées depuis longtemps en extration d'information. Ces méthodes enrichissent un document en y ajoutant des données sémantiquement équivalentes aux informations originales, afin d'améliorer le rappel. Par exemple, certaines de ces approches exploitent des dictionnaires de synonymes pour ajouter aux phrases des mots de signification proche. Cependant, cette technique présente certains désavantages, car ces mots sont habituellement synonymes seulement dans certains contextes. Nous proposons une méthodologie qui utilise un système de désambiguïsation sémantique pour restreindre la sélection des synonymes et conserver seulement ceux qui correspondent au contexte syntaxico-sémantique. Nous montrons comment les règles de désambiguïsation sémantiques sont construites et dans quelle mesure les techniques d'extraction d'information peuvent profiter de l'application de ces règles.