Uniformisation d'encodage en deux étapes

Fiche du document

Date

29 septembre 2020

Discipline
Types de document
Périmètre
Identifiant
Source

Tekipaki

Relations

Ce document est lié à :
info:eu-repo/semantics/reference/issn/2729-465X

Organisation

OpenEdition

Licence

info:eu-repo/semantics/openAccess



Citer ce document

Alexander Delaporte, « Uniformisation d'encodage en deux étapes », Tekipaki, ID : 10.58079/up29


Métriques


Partage / Export

Résumé 0

La lecture préalable de l'article Fiabilité de chardet est fortement conseillée. Lorsqu'on travaille avec un corpus textuel composé de nombreux fichiers dont l'encodage n'est pas uniforme, l'une des premières étapes de traitement est de convertir l'ensemble du corpus vers un encodage unique et reconnu par les outils qui seront utilisés ensuite. Il existe plusieurs façons d'y parvenir, telle que celle présentée dans cet article, qui fait appel à chardet. Toutefois, en fonction de la compo...

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en