2015
Cairn
Vincent Claveau et al., « Thésaurus distributionnels pour la recherche d’information et vice-versa », Document numérique, ID : 10670/1.rjzf2e
Les thésaurus distributionnels sont utiles à de nombreuses tâches du traitement automatique des langues. Dans cet article, nous abordons les problèmes de leur construction et de leur évaluation sous l’angle de la recherche d’information. Deux contributions sont proposées. D’une part, en poursuite des travaux initiés par Claveau et al., 2014, nous montrons comment les techniques de RI peuvent être utilisées avec succès pour construire ces thésaurus. Au moyen d’une évaluation directe par comparaison avec des lexiques de référence et au travers de plusieurs expérimentations, nous montrons que les résultats obtenus par des modèles de RI dépassent les performances des systèmes état de l’art. D’autre part, nous utilisons la RI comme cadre applicatif pour proposer une évaluation indirecte des thésaurus produits. Là encore, cette évaluation valide l’approche. Mais surtout, elle permet de mettre en regard les performances obtenues sur cette tâche avec celles des évaluations directes utilisées dans la littérature. Les différences constatées remettent en cause en partie ces pratiques d’évaluation.