La contribution des cooccurrences de deuxième ordre à l’analyse sémantique

Fiche du document

Date

27 juin 2013

Discipline
Type de document
Périmètre
Langue
Identifiant
Source

Corpus

Relations

Ce document est lié à :
info:eu-repo/semantics/reference/issn/1638-9808

Ce document est lié à :
info:eu-repo/semantics/reference/issn/1765-3126

Organisation

OpenEdition

Licences

All rights reserved , info:eu-repo/semantics/openAccess




Citer ce document

Ann Bertels et al., « La contribution des cooccurrences de deuxième ordre à l’analyse sémantique », Corpus, ID : 10.4000/corpus.2184


Métriques


Partage / Export

Résumé Fr En

Cet article montre ce que la cooccurrence peut nous apprendre sur la monosémie et comment on peut exploiter l’analyse des cooccurrences de deuxième ordre pour quantifier l’analyse sémantique. Les analyses sont conduites sur un corpus technique (1,7 million d’occurrences) relevant du domaine spécialisé des machines-outils pour l’usinage des métaux. Dans cet article, nous expliquons la méthodologie adoptée pour déterminer le degré de monosémie d’un mot technique à partir de l’analyse du recoupement de ses cooccurrences de deuxième ordre. Dans le but d’affiner les résultats de la mesure de recoupement, nous procédons également à quelques expérimentations qui vont au-delà du simple repérage statistique des cooccurrences et qui font varier différents paramètres, tels que la fenêtre d’observation, le seuil de significativité et la forme graphique ou le lemme des cooccurrences de premier et deuxième ordre. Finalement, nous abordons l’importance de l’intégration des étiquettes morphosyntaxiques dans l’analyse des cooccurrences.

The Contribution of Second Order Co-occurrences to Semantic AnalysisThis article shows what co-occurrence can learn us about monosemy and explores the contribution of second order co-occurrences to quantitative semantic analysis. The analysis is carried out on a technical corpus (1.7 million occurrences) from the specialised domain of machining and metalworking terminology in French. In this article, we explain the methodology for calculating the degree of monosemy of a technical word based on the overlap of its second order co-occurrences. Next, in order to refine the results of the overlap measure, several experiments are discussed, going beyond statistical detection of co-occurrence patterns and showing the impact of several varying parameters, such as co-occurrence span, significance level and word form or lemma of first and second order co-occurrences. Finally, the article addresses the importance of the integration of POS-tags in co-occurrence analysis.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en