2003
Ce document est lié à :
Revue québécoise de linguistique ; vol. 32 no. 1 (2003)
Tous droits réservés © Revue québécoise de linguistique, 2003
Nabil Hathout et al., « Webaffix : une boîte à outils d’acquisition lexicale à partir du Web », Revue québécoise de linguistique, ID : 10.7202/012244ar
Nous présentons ici Webaffix, un outil qui permet de constituer et d’enrichir semi-automatiquement des données lexicales en utilisant le Web comme corpus. Il permet de détecter et d’analyser morphologiquement des unités lexicales nouvelles (c’est-à-dire absentes de listes de référence telles que les dictionnaires) construites par suffixation ou préfixation. Nous présentons les techniques utilisées par Webaffix, en déclinant les différents modes d’utilisation que nous avons envisagés et mis en pratique, ainsi que des exemples de résultats produits par diverses campagnes de collecte. Les données ainsi recueillies constituent des ressources lexicales pour différentes applications en traitement automatique des langues, mais également pour l’étude à grande échelle de la morphologie dérivationnelle.