Webaffix : une boîte à outils d’acquisition lexicale à partir du Web

Fiche du document

Date

2003

Discipline
Type de document
Périmètre
Langue
Identifiant
Relations

Ce document est lié à :
Revue québécoise de linguistique ; vol. 32 no. 1 (2003)

Collection

Erudit

Organisation

Consortium Érudit

Licence

Tous droits réservés © Revue québécoise de linguistique, 2003



Citer ce document

Nabil Hathout et al., « Webaffix : une boîte à outils d’acquisition lexicale à partir du Web », Revue québécoise de linguistique, ID : 10.7202/012244ar


Métriques


Partage / Export

Résumé Fr En

Nous présentons ici Webaffix, un outil qui permet de constituer et d’enrichir semi-automatiquement des données lexicales en utilisant le Web comme corpus. Il permet de détecter et d’analyser morphologiquement des unités lexicales nouvelles (c’est-à-dire absentes de listes de référence telles que les dictionnaires) construites par suffixation ou préfixation. Nous présentons les techniques utilisées par Webaffix, en déclinant les différents modes d’utilisation que nous avons envisagés et mis en pratique, ainsi que des exemples de résultats produits par diverses campagnes de collecte. Les données ainsi recueillies constituent des ressources lexicales pour différentes applications en traitement automatique des langues, mais également pour l’étude à grande échelle de la morphologie dérivationnelle.

This paper deals with the design and use of Webaffix, a tool for semi-automatically detecting new word forms from the World Wide Web. We focus mainly on new derived words, i.e. coined from other lexemes through suffixation and/or prefixation processes. We develop the techniques and methods used in Webaffix, along with a sample of results obtained via several studies on French. Resources such as the ones created through the use of Webaffix are useful not only for natural language processing and information retrieval tasks, but also for the linguistic study of word creation.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en