10 mars 2004
Ce document est lié à :
info:eu-repo/semantics/altIdentifier/arxiv/cs.IR/0506047
info:eu-repo/semantics/OpenAccess
Bernard Jacquemin, « Analyse et expansion des textes en question-réponse », HAL-SHS : sciences de l'information, de la communication et des bibliothèques, ID : 10670/1.rt6a9h
Cet article présente une méthode originale d'envisager la tâche de question-réponse. Nous avons remarqué que l'expansion de requête est souvent erronée du fait d'une mécompréhension de la question. Mais la bonne compréhension d'un énoncé est fonction de la taille du contexte, et les question sont souvent courtes. Notre approche propose d'analyser les documents et de construire une structure informationnelle en utilisant les résultats de l'analyse ainsi que l'enrichissement sémantique des textes. Une analyse linguistique identifie les mots (segmentation et analyse morphologique), les liens entre les mots (analyse syntaxique) et le sens des mots (désambiguïsation sémantique lexicale). L'expansion de texte adjoint à chaque mot les synonymes qui correspondent à son acception contextuelle et remplacent les mots des énoncés par leurs dérivés, modifiant si nécessaire la structure syntaxique de la phrase. De la sorte, quel que soit l'enrichissement utilisé, le texte conserve la même signification, tandis que chaque élément d'information obtient de nombreuses actualisations. La procédure d'interrogation consiste à construire une structure informationnelle locale à la question sans effectuer d'enrichissement, et à faire lui faire correspondre un ou plusieurs fragments de la structure documentaire. Si une phrase de la structure informationnelle documentaire correspond à celle de la question, cette phrase contient la réponse à la question.