2012
Cairn
Anaïs Lefeuvre et al., « Hétérogénéité et extraction d'information factuelle dans un corpus de récits de voyage », Langages, ID : 10670/1.cuj9ua
L’extraction d’information nécessite une connaissance des objets à extraire. Nous cherchons dans ce travail à décrire le comportement des séquences textuelles présentant l’itinéraire au sein du récit de voyage. Le récit de voyage est reconnu comme genre hétérogène, nous analysons donc cette hétérogénéité afin de pouvoir reconnaître les séquences homogènes, dont la description d’itinéraire fait partie. Nous menons notre analyse à plusieurs niveaux discursifs, ce qui nous permet d’avoir une vision globale du comportement de notre objet d’étude, l’itinéraire et du contexte dans lequel il apparaît. Dans la perspective de l’extraction automatique d’itinéraire, nous utilisons de nombreux outils, chacun adapté au mieux au niveau d’analyse traité. En nous appuyant sur le cadre théorique de la SRDT (Segmented Discourse Representation Theory), dont nous montrons l’adéquation à l’étude, nous approchons le fonctionnement des descriptions des itinéraires, nous poussant à enrichir la méthode d’extraction afin de gérer l’hétérogénéité des unités discursives dans lesquels l’itinéraire est énoncé.