Recherche d'information dans Medline

Fiche du document

Date

2007

Type de document
Périmètre
Langue
Identifiant
Collection

Cairn.info

Organisation

Cairn

Licence

Cairn




Citer ce document

Samir Abdou et al., « Recherche d'information dans Medline », Document numérique, ID : 10670/1.e60bt7


Métriques


Partage / Export

Résumé Fr En

Cet article décrit la banque documentaire Medline depuis laquelle une collection test comprenant environ 4,5 million de documents structurés a été construite à partir des campagnes d’évaluation TREC. Dans une deuxième partie, nous évaluons et comparons l’efficacité du dépistage de l’information de dix modèles (probabiliste, modèle de langue, approches vectorielles). Cette évaluation est complétée par l’analyse de l’efficacité de trois enracineurs (stemmers) pour la recherche d’information œuvrant dans un contexte spécifique. L’impact des descripteurs MeSH, manuellement sélectionnés pour chaque article, complète cette analyse. Enfin nous avons conçu deux nouvelles approches d’expansion automatique des requêtes, l’une générale l’autre spécifique et nous les avons évaluées en les comparant au modèle proposé par Rocchio.

In this paper we describe the Medline collection from which a test-collection containing around 4.5 million of structured documents have been built from the past TREC evaluation campaigns. Second this paper evaluates and compares ten different IR models (probabilistic, language model and vector-space approaches) on the one hand, and on the other we also compare three different stemming strategies used in a domain-specific IR. The impact that manually assigned descriptors (MeSH headings) have on retrieval effectiveness is also evaluated. Finally, we propose both a new general blind-query expansion and a domain-specific query expansion scheme and compare them with the more classic Rocchio approach.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en