{Repo} Text Processing

Fiche du document

Auteur
Date

5 avril 2020

Types de document
Périmètre
Identifiant
Relations

Ce document est lié à :
info:eu-repo/semantics/reference/issn/2742-0914

Organisation

OpenEdition

Licence

info:eu-repo/semantics/openAccess



Citer ce document

J-T. M., « {Repo} Text Processing », Research repository of Jean-Thomas Martelli, ID : 10.58079/ql6i


Métriques


Partage / Export

Résumé 0

Scripts to batch process textual data for analysis in R, Python, TXM and IRaMuTeQ. The repo contains tools to extract text – and its metadata – from digital sources (PDFs, HTML, SRT), clean it (layout and OCR corrections) and format it in a CSV+TXT format for analysis.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en