16 juin 2020
Ce document est lié à :
info:eu-repo/semantics/altIdentifier/arxiv/2012.05541
info:eu-repo/semantics/OpenAccess
Maria Zimina-Poirot et al., « Approches quantitatives de l'analyse des prédictions en traduction automatique neuronale (TAN) », HAL-SHS : linguistique, ID : 10670/1.wb42kv
Dans le cadre d’un projet plus vaste consacré à l’analyse des conditions d’apprentissage optimales pour la traduction, nous cherchons à identifier des phases caractéristiques de l’entraînement des moteurs de traduction neuronaux. Nos expériences ont été réalisées avec OpenNMT-Py. Le pré-traitement a été effectué sur le corpus d’entraînement Europarl et le corpus de validation INTERSECT. Les analyses longitudinales des différentes phases d’entraînement suggèrent que la progression des traductions n’y est pas toujours linéaire. Les analyses textométriques des volets montrent l’importance des phénomènes liés à la progression chronologique et permettent établir progressivement une cartographie des processus à l’œuvre dans la traduction automatique neuronale (TAN).