Une approche textométrique pour étudier la transmission des savoirs biologiques au XIXe siècle

Fiche du document

Date

2016

Discipline
Type de document
Périmètre
Langue
Identifiant
Relations

Ce document est lié à :
Nouvelles perspectives en sciences sociales ; vol. 12 no. 1 (2016)

Collection

Erudit

Organisation

Consortium Érudit

Licence

Tous droits réservés © Prise de parole, 2016




Citer ce document

Philippe Gambette et al., « Une approche textométrique pour étudier la transmission des savoirs biologiques au XIXe siècle », Nouvelles perspectives en sciences sociales: Revue internationale de systémique complexe et d'études relationnelles, ID : 10.7202/1038375ar


Métriques


Partage / Export

Résumé Fr En

Cet article propose d’aborder la question du positionnement entre qualitatif et quantitatif (que suppose l’analyse informatisée de données textuelles) au travers d’exemples concrets tirés d’un projet de recherche se situant dans le domaine de la création littéraire et son rapport aux savoirs biologiques (Biolographes : http://biolog.hypotheses.org). Une première partie expose les aspects pratiques des corpus numériques, de l’accès aux sources à leurs métadonnées, en passant par les questions d’océrisation et de stockage (base de données). Les deuxième et troisième parties illustrent la façon dont des outils textométriques et de visualisation (TXM, Treecloud) servent de point d’appui, dans le cas de grands corpus, à de nombreuses hypothèses de travail. En conclusion, il souligne le pont opéré par le TAL entre les outils informatisés et l’analyse littéraire.

This article addresses the issue of the relationship between qualitative and quantitative analysis (i.e. computerized analysis of textual data) through experiments (and their results) conducted in a research project focusing on the impact of biological knowledge on French literary work in the XIXth century (Biolographes: http://biolog.hypotheses.org). The first part sets out the practical aspects of digital corpora, from access to the texts, to their transformation by OCR, to the storage of their metadata. The second and third parts illustrate how textometrical tools and visualizations (TXM, TreeCloud) serve as a point d’appui to many working hypotheses. In conclusion, the article emphasizes the role played by NLP in computerized tools for literary analysis.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en