2007
Cairn
Samir Abdou et al., « Recherche d'information dans Medline », Document numérique, ID : 10670/1.e60bt7
Cet article décrit la banque documentaire Medline depuis laquelle une collection test comprenant environ 4,5 million de documents structurés a été construite à partir des campagnes d’évaluation TREC. Dans une deuxième partie, nous évaluons et comparons l’efficacité du dépistage de l’information de dix modèles (probabiliste, modèle de langue, approches vectorielles). Cette évaluation est complétée par l’analyse de l’efficacité de trois enracineurs (stemmers) pour la recherche d’information œuvrant dans un contexte spécifique. L’impact des descripteurs MeSH, manuellement sélectionnés pour chaque article, complète cette analyse. Enfin nous avons conçu deux nouvelles approches d’expansion automatique des requêtes, l’une générale l’autre spécifique et nous les avons évaluées en les comparant au modèle proposé par Rocchio.