10 septembre 2019
info:eu-repo/semantics/OpenAccess
Mathilde Jouvel-Triollet, « Repérage et identification automatiques de noms de lieux avec variations d'écriture dans des corpus », DUMAS - Dépôt Universitaire de Mémoires Après Soutenance, ID : 10670/1.ds315d
Les toponymes sont parfois amenés à subir des variations d’écriture et voient leur graphie s’éloigner de celle que nous trouvons habituellement dans les dictionnaires de noms propres. Ces variations d’écriture peuvent dépendre du type de corpus dont les toponymes sont issus, du registre, du temps ou du langage que couvre le corpus. Nous proposons une méthode pour identifier un toponyme, c’est-à-dire faire le lien entre un toponyme avec variations d’écriture et sa forme normée. Le présent mémoire se divise en trois parties. Dans une première partie nous présenterons le terrain de stage. Dans un second temps nous décrirons les missions confiées puis nous exposerons l’approche envisagée ainsi que les outils utilisés pour répondre aux missions. Enfin, nous proposerons des solutions afin de répondre au mieux au besoin d’identification de toponymes avec variations d’écriture.