2011
Cairn
Loïc Maisonnasse et al., « Approche statistique versus approche linguistique pour l'indexation sémantique des documents multilingues », Document numérique, ID : 10670/1.eqgj2q
Dans cet article nous présentons une approche statistique d’indexation sémantique des documents multilingues. L’approche que nous proposons est composée de trois étapes : extraction des termes, détection des concepts et détection des relations à partir des couples de concepts. Notre approche est validée par un ensemble d’expérimentations sur la collection ImageCLEFmed 2007 et une comparaison avec une approche linguistique. Nous montrons ainsi que l’approche statistique obtient des résultats équivalents à l’approche linguistique sans adapter la phase d’indexation à la langue du document.