2003
Ce document est lié à :
Revue québécoise de linguistique ; vol. 32 no. 1 (2003)
Tous droits réservés © Revue québécoise de linguistique, 2003
Christophe Fouqueré et al., « Corpus issus du Web : constitution et analyse informationnelle », Revue québécoise de linguistique, ID : 10.7202/012246ar
Comparé à d’autres sources d’informations (documents techniques, articles de journaux, ...), le Web est une source quasi infinie d’informations de toute nature. Cet avantage peut s’avérer contreproductif si une information pertinente se trouve noyée dans une masse d’informations diverses. Notre travail tente donc d’évaluer dans quelle mesure des techniques de traitement automatique du langage naturel peuvent aider dans la recherche d’informations lorsque la base de données textuelles est non organisée. Plus concrètement, notre étude vise la spécification de mécanismes de reformulation de requêtes. Nous tentons ici de décrire la méthodologie de constitution de corpus suivie, puis nous analysons la pertinence informationnelle des pages récupérables sur le web lorsqu’on fait varier la requête initiale.