17 mars 2021
info:eu-repo/semantics/OpenAccess
Raoul Blin, « Kittajafr-v1-1.0.0 », HAL-SHS : linguistique, ID : 10670/1.sw5onj
Ce guide présente le kit kittajafr-v1. Il s’agit d’un ensemble de ressources et d’outils permettant de construire un petit modèle de traduction neuronal du japonais vers le français. Ce guide dresse un rapide état des lieux de la traduction ja > fr. Il explique comment préparer un corpus d’entraînement, paramétrer le logiciel d’apprentissage et de traduction. Toutes les ressources du kittajafr sont librement distribuées. Des logiciels non fournis dans le kit sont nécessaires mais eux aussi librement disponibles. Le corpus est de petite taille : ≈70K exemples alignés. La qualité des traductions est basse.