14 juin 2010
info:eu-repo/semantics/OpenAccess
Claire Lemaire, « Vers une analyse génétique de textes assistée par l'informatique et le TAL : contextes et pistes exploratoires », DUMAS - Dépôt Universitaire de Mémoires Après Soutenance, ID : 10670/1.3hlhfu
L'apparition de corpus numériques de manuscrits littéraires a enrichi notre patrimoine d'une donnée langagière analysable et traitable automatiquement. La transcription du contenu de ces manuscrits dans un format numérique textuel permet de parcourir en quelques secondes des milliers de mots. L'étude des différentes versions d'une œuvre littéraire donne lieu à des enquêtes fastidieuses de la part des chercheurs en littérature. Se posent alors de nouvelles questions de méthodologie de travail : comment exploiter au mieux l'outil informatique pour assister le chercheur, quelles sont les nouvelles études envisageables grâce aux progrès ? Après un aperçu de l'analyse génétique et d'outils de traitement automatique des langues existants dans le domaine, nous présentons la modélisation sur les manuscrits de Stendhal de trois fonctionnalités à trois niveaux de granularité qui assisteraient les chercheurs en littérature dans leur analyse sur les bibliothèques d'auteurs, le théâtre ou le code-switching.