1 décembre 2020
Ce document est lié à :
info:eu-repo/semantics/altIdentifier/arxiv/1810.09947
Ce document est lié à :
info:eu-repo/semantics/altIdentifier/doi/10.54563/lexique.553
Ce document est lié à :
info:eu-repo/grantAgreement//COST IC1207/EU/Parsing and Multi-Word Expressions/PARSEME
info:eu-repo/semantics/OpenAccess
Agata Savary et al., « Object-oriented lexical encoding of multiword expressions: Short and sweet », HAL-SHS : linguistique, ID : 10.54563/lexique.553
Les Expressions polylexicales (EP) possèdent des propriétés à la fois régulières et idiosyncratiques. Leur idiosyncrasie requiert un codage lexical au même titre que celui des mots qui les composent. D'autre part, leur régularité (parfois complexe) nécessite des moyens de factorisation afin d'éviter des descriptions redondantes des propriétés partagées. À ce jour, il n'existe pas de solution idéale pour le codage lexical généraliste et non redondant des EP. Dans cet article nous présentons une preuve de concept que ce défi pourrait être relevé dans le cadre de XMG (eXtensible MetaGrammar), qui est un formalisme métagrammatical orienté-objet. Nous montrons comment une ressource métagrammaticale existante, FrenchTAG, peut être étendue pour couvrir les EP. Nous évaluons le gain en termes de factorisation de cette ressource lors de son développement incrémental. Cette expérience est menée sur un jeu de données extrait d'un corpus de référence annoté en EP.