Semantic typing of nouns in the Demonette morphological resource Typage sémantique des noms dans la ressource morphologique Démonette En Fr

Fiche du document

Date

23 décembre 2023

Discipline
Type de document
Périmètre
Langue
Identifiants
Relations

Ce document est lié à :
info:eu-repo/semantics/altIdentifier/doi/10.54563/lexique.1086

Collection

Archives ouvertes

Licences

http://creativecommons.org/licenses/by/ , info:eu-repo/semantics/OpenAccess




Citer ce document

Mathilde Huguin et al., « Typage sémantique des noms dans la ressource morphologique Démonette », HAL-SHS : linguistique, ID : 10.54563/lexique.1086


Métriques


Partage / Export

Résumé En Fr

This article describes the methodology used to carry out the semantic annotation of part of the nouns in the Démonette-2 morphological database. First, we present the set of semantic labels selected for this annotation. This set of labels is a revised adaptation of Wordnet’s Unique Beginners, and each label is provided by a definition and linguistic tests enabling a label to be assigned to a noun. We then describe the two methods used to annotate the nouns. The first one is an automatic method that matches the labels present in the morphological databases feeding Démonette-2 with the revised set of labels. The second method involved manually annotating a subset of nouns. Finally, we give a quantitative assessment of our annotation, presenting the distribution of monosemic/polysemic nouns and the most frequent semantic labels. This initial semantic annotation work provides a set of 58,099 nouns with one or more semantic labels. This set of nouns already offers a host of analytical possibilities that would be impossible without access to a large database of semantically and morphologically annotated data, such as the study of competing processes or the examination of the polyfunctionality of affixes.

Cet article décrit la méthodologie mise en place pour effectuer l’annotation sémantique d’une partie des noms de la base de données morphologiques Démonette-2. Nous y présentons d’abord le jeu d’étiquettes sémantiques sélectionné pour effectuer cette annotation. Ce jeu d’étiquettes est une adaptation révisée des Unique Beginners de Wordnet et chaque étiquette est accompagnée d’une définition et de tests linguistiques permettant l’attribution d’une étiquette à un nom. Nous détaillons ensuite les deux méthodes utilisées pour annoter les lexèmes nominaux. La première méthode, automatique, a consisté à apparier les étiquettes présentes dans les bases de données morphologiques alimentant Démonette‑2 avec le jeu d’étiquettes révisé. La seconde méthode a consisté à annoter manuellement un sous-ensemble de noms. Nous donnons enfin un bilan quantitatif de notre annotation en présentant notamment la distribution des noms monosémiques / polysémiques et les étiquettes sémantiques les plus fréquentes. Ce premier travail d’annotation sémantique fournit un ensemble de 58 099 noms disposant d’une ou plusieurs étiquettes sémantiques. Cet ensemble de noms offre déjà de multiples possibilités d’analyses, impossibles sans accès à une large base de données annotées sémantiquement et morphologiquement, comme l’étude de procédés concurrents ou encore l’examen de la polyfonctionnalité des affixes.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en