27 septembre 2007
info:eu-repo/semantics/OpenAccess
Amalia Todirascu et al., « Extracting collocations in context: the case of verb-noun constructions in Romanian », HAL-SHS : linguistique, ID : 10670/1.m6qbu1
Les constructions Verbo-Nominales (VN) sont composées d’un V générique et d’un N spécifique, lequel est soit (i) qualifieur structurel du Prédicateur comme faire faillite, soit (ii) Complément syntaxique comme faire des recommandations. Dans chaque cas, le N exprime la Portée sémantique de la construction (Banks 2000, Gledhill2007). Mais malgré quantité d’études sur les ‘verbes supports’ ou ‘verbes légers’, aucune propriété morpho-syntaxique ne permet de distinguer ces constructions des autres séquences V plus N, au moins en anglais. Du point de vue de l’analyste de corpus, ce manque de marque formelle rend difficile la conception d’un outild’extraction automatique. Dans le cadre d’un projet lexicographique, nous avons étudié plusieurs modèlesdestinés à extraire des VN des corpus multilingues. Nos résultats préliminaires indiquent que des méthodes purement statistiques ne sont pas suffisantes : les données révèlent parfois de ‘véritables’ constructions VN,mais aussi pour la plupart des exemples ‘non-pertinents’ de cooccurrences VN, ou tout simplement du bruit.