Utiliser une base distributionnelle pour filtrer un dictionnaire de synonymes

Fiche du document

Date

21 juin 2013

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess




Citer ce document

François Morlane-Hondère, « Utiliser une base distributionnelle pour filtrer un dictionnaire de synonymes », HAL-SHS : linguistique, ID : 10670/1.3oy1du


Métriques


Partage / Export

Résumé En Fr

In this study, we aim to highlight the benefits of using a distributional resource to improve the sorting of the synonyms contained in a dictionary. We compare a distributional resource which was created from a Wikipedia corpus and the Electronic Dictionary of Synonyms of CRISCO. We show that only a part of a given word's synonyms share its contexts in the Wikipedia corpus. We find several explanations for this phenomenon. Then, we compare the dictionary with other distributional resources and we show that the nature of the corpus affects the range of the discrepancy. That means that the nature of the corpus has an influence on the kind of synonyms that appear in the distributional resources. We plan to use this principle for the automatic reorganization of the dictionary's synonyms.

Cette étude vise à mettre en lumière l'intérêt qu'il peut y avoir à se servir d'une ressource générée par analyse distributionnelle automatique pour orienter les résultats fournis par un dictionnaire de synonymes. En croisant une base distributionnelle calculée à partir d'un corpus constitué d'articles de l'encyclopédie Wikipédia et le Dictionnaire Électronique des Synonymes du CRISCO, nous montrons qu'une partie seulement des synonymes proposés pour un mot donné partagent ses contextes d'apparition. Nous mettons au jour plusieurs raisons qui expliquent ce phénomène. Nous montrons ensuite que ce décalage s'observe différemment selon la nature du corpus qui a permis de calculer la base distributionnelle qui sert à filtrer le dictionnaire. Cela signifie que la nature du corpus oriente le type de synonymes filtrés par la base distributionnelle. Nous envisageons d'appliquer ce principe dans un système de réorganisation dynamique des synonymes du dictionnaire du CRISCO.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en