27 novembre 2003
info:eu-repo/semantics/OpenAccess
Hélène Manuélian, « Descriptions définies et démonstratives : Analyses de Corpus pour la Génération de Textes », HAL-SHS : linguistique, ID : 10670/1.ji5jf4
Cette thèse porte sur la génération d'expressions référentielles dont la réalisation est basée sur des inférences. Une étude de corpus nous a permis de proposer trois pistes d'extensions de l'algorithme de Gardent et Striegnitz, qui produit des descriptions définies coréférentielles et des anaphores associatives. Les données connues sur l'utilisation des descritptions définies et démonstratives étant insuffisantes pour la génération, l'étude de corpus a permis d'affiner les données et d'étendre l'algorithme de génération pour qu'il produise : des anaphores associatives en tenant compte des sources d'inférences permettant de construire la relation entre un antécédent et une anaphore ; des descriptions coréférentielles en intégrant la possibilité de générer des reprises n'apportant pas d'information sur le référent ; un algorithme de choix entre défini et démonstratif.