11 décembre 2019
info:eu-repo/semantics/OpenAccess
Afef Selmi, « L’ambiguïté anaphorique et la résolution automatique de l’anaphore pronominale: Propositions méthodologiques à partir d’un corpus fermé de résumés d’œuvres littéraires en français (RESUMAN) », HAL-SHS : linguistique, ID : 10670/1.lseyso
Les anaphores pronominales sont sources d’ambiguïtés potentielles lors de l’exécution de requêtes cherchant bon antécédent. Dans un contexte d’automatisation du traitement linguistique et textuel, la recherche en traitement automatique des langues (TAL) a déjà mis en place diverses approches pour résoudre le problème. Nous nous proposons dans cette thèse d’adapter ces approches à la résolution automatique des anaphores pronominales dans un corpus fermé de résumés d’œuvres littéraires en français (RESUMAN).Dans un premier temps sont présentés les modèles linguistiques, textuels et cognitifs, qui rendent compte du fonctionnement et de l’interprétation des pronoms personnels dans des textes en français. Ensuite sont exposées les procédures d'interprétation des anaphores pronominales : la procédure de distance minimale, la procédure des fonctions parallèles, la procédure du sujet ou la procédure thématique, ainsi que les procédures d'analyse morphologique, sémantique et pragmatique. Le corps de la thèse présente, enfin, une nouvelle version d’algorithme, se basant sur une approche statistique. L’outil RESUMAN permet d’améliorer les performances d’un TAL en cas de textes denses en anaphores pronominales comme ceux du corpus-échantillon étudié. Les performances de cet outil sont évaluées et ses limites sont commentées.