Analyse et expansion des textes en question-réponse

Fiche du document

Date

10 mars 2004

Discipline
Type de document
Périmètre
Langue
Identifiants
Relations

Ce document est lié à :
info:eu-repo/semantics/altIdentifier/arxiv/cs.IR/0506047

Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess




Citer ce document

Bernard Jacquemin, « Analyse et expansion des textes en question-réponse », HAL-SHS : sciences de l'information, de la communication et des bibliothèques, ID : 10670/1.rt6a9h


Métriques


Partage / Export

Résumé En Fr

This paper presents an original methodology to consider question answering. We noticed that query expansion is often incorrect because of a bad understanding of the question. But the automatic good understanding of an utterance is linked to the context length, and the question are often short. This methodology proposes to analyse the documents and to construct an informative structure from the results of the analysis and from a semantic text expansion. The linguistic analysis identifies words (tokenization and morphological analysis), links between words (syntactic analysis) and word sense (semantic disambiguation). The text expansion adds to each word the synonyms matching its sense and replaces the words in the utterances by derivatives, modifying the syntactic schema if necessary. In this way, whatever enrichment may be, the text keeps the same meaning, but each piece of information matches many realisations. The questioning method consists in constructing a local informative structure without enrichment, and matches it with the documentary structure. If a sentence in the informative structure matches the question structure, this sentence is the answer to the question.

Cet article présente une méthode originale d'envisager la tâche de question-réponse. Nous avons remarqué que l'expansion de requête est souvent erronée du fait d'une mécompréhension de la question. Mais la bonne compréhension d'un énoncé est fonction de la taille du contexte, et les question sont souvent courtes. Notre approche propose d'analyser les documents et de construire une structure informationnelle en utilisant les résultats de l'analyse ainsi que l'enrichissement sémantique des textes. Une analyse linguistique identifie les mots (segmentation et analyse morphologique), les liens entre les mots (analyse syntaxique) et le sens des mots (désambiguïsation sémantique lexicale). L'expansion de texte adjoint à chaque mot les synonymes qui correspondent à son acception contextuelle et remplacent les mots des énoncés par leurs dérivés, modifiant si nécessaire la structure syntaxique de la phrase. De la sorte, quel que soit l'enrichissement utilisé, le texte conserve la même signification, tandis que chaque élément d'information obtient de nombreuses actualisations. La procédure d'interrogation consiste à construire une structure informationnelle locale à la question sans effectuer d'enrichissement, et à faire lui faire correspondre un ou plusieurs fragments de la structure documentaire. Si une phrase de la structure informationnelle documentaire correspond à celle de la question, cette phrase contient la réponse à la question.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en