29 septembre 2020
Ce document est lié à :
info:eu-repo/semantics/reference/issn/2729-465X
info:eu-repo/semantics/openAccess
Alexander Delaporte, « Uniformisation d'encodage en deux étapes », Tekipaki, ID : 10.58079/up29
La lecture préalable de l'article Fiabilité de chardet est fortement conseillée. Lorsqu'on travaille avec un corpus textuel composé de nombreux fichiers dont l'encodage n'est pas uniforme, l'une des premières étapes de traitement est de convertir l'ensemble du corpus vers un encodage unique et reconnu par les outils qui seront utilisés ensuite. Il existe plusieurs façons d'y parvenir, telle que celle présentée dans cet article, qui fait appel à chardet. Toutefois, en fonction de la compo...