2008
Ce document est lié à :
info:eu-repo/semantics/altIdentifier/arxiv/0801.1179
http://creativecommons.org/licenses/by-nc-nd/ , info:eu-repo/semantics/OpenAccess
Bernard Jacquemin et al., « Corpus spécialisé et ressource de spécialité. L'information forme le sens », HAL-SHS : sciences de l'information, de la communication et des bibliothèques, ID : 10670/1.5m2l4i
Les Atlas sémantiques sont un modèle mathématique et statistique de représentation visuelle de la sémantique lexicale basé sur l'examen des relations entre les mots. Une application de ce modèle à des relations de proximité contextuelle dans un corpus a permis de montrer que le modèle était capable de dénoter le sens des unités lexicales tel qu'il est perçu par les rédacteurs du corpus. Nous nous appuyons sur ce constat pour proposer d'exploiter le modèle afin de construire automatiquement un dictionnaire spécialisé dans un domaine précis par l'analyse d'un corpus représentatif de ce domaine. Tout en conservant le modèle, nous modifions son application en faisant intervenir une analyse morphologique et syntaxique pour établir la réalité des unités lexicales ainsi que les liens entre elles, qui sont dès lors de nature syntaxique. Nous proposons également d'utiliser la ressource produite pour naviguer dans le corpus utilisé considéré comme une base d'information en suivant le sens plutôt que le mot. Enfin, nous proposons d'exploiter cette approche pour aider à la réalisation de dictionnaires plus classiques ou pour étudier la langue en diachronie.