2019
Ce document est lié à :
TTR : Traduction, terminologie, rédaction ; vol. 32 no. 1 (2019)
Tous droits réservés © ÉricAndréPoirier, 2020
Éric André Poirier, « Repérage des décalages informationnels de traduction au moyen du criblage automatique des segments hétéromorphes d’un corpus parallèle », TTR: Traduction, terminologie, rédaction, ID : 10.7202/1068022ar
Nous présentons une méthode de criblage quantitatif et automatique des segments hétéromorphes dans les corpus parallèles de traductions qui rationalise la recherche qualitative et manuelle des décalages de traduction informationnels. Ces derniers fournissent des données sur la traduction comme résultat qui servent à caractériser les idiosyncrasies textuelles et linguistiques des langues en contact et qui renseignent aussi sur les biais individuels du sujet traduisant ainsi que sur les biais culturels inhérents à l’opération de traduction pour les langues-cultures en contact. Pour montrer comment fonctionne la méthode de repérage, nous l’appliquons à un corpus de traductions alignées avec leur segment source. Le corpus contient un discours en anglais du président américain John F. Kennedy (1961) et un discours de la première ministre britannique Theresa May (2017) qui ont été traduits en français. Pour le criblage automatique des segments hétéromorphes, l’algorithme PML (précision des mots lexicaux) analyse automatiquement les paires de segments source et cible et compare le nombre de mots lexicaux dans les segments source et cible pour calculer le ratio de la précision de l’information traduite (PIT). Par la suite, les segments hétéromorphes criblés au moyen du ratio PIT sont analysés manuellement pour déterminer l’origine ou la cause de la variation des contenus informatifs de la traduction et définir les repérages qu’elle entraîne, le cas échéant. La méthode offre l’avantage de rationaliser la recherche de décalages dans les segments hétéromorphes négatifs et positifs des textes traduits dans un corpus parallèle, puisqu’elle permet de cibler et de cribler les paires de segments hétéromorphes qui sont le plus susceptibles de contenir des décalages informationnels de traduction.