Plaidoyer pour la statistique linguistique

Fiche du document

Date

2011

Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess




Citer ce document

Étienne Brunet, « Plaidoyer pour la statistique linguistique », HAL-SHS : littérature, ID : 10670/1.o2u63w


Métriques


Partage / Export

Résumé Fr

Les données textuelles ont des propriétés très avantageuses que Guiraud avait soulignées, dès 1959, deux ans après le colloque de Strasbourg : « La linguistique est la science statistique type ; les statisticiens le savent bien ; les linguistes l’ignorent encore.» Ces données sont d’abord bon marché ; il suffit d’un traitement de texte pour les enregistrer, ou d’un scanner, ou tout simplement d’une liaison à Internet où les textes foisonnent. Elles sont abondantes ; or la statistique se plaît dans les grands nombres et ses conclusions sont moins sûres quand les observations sont en nombre limité parce qu’elles sont chères, ce qui est le cas des enquêtes et des sondages, ou que la nature des choses le veut ainsi, comme il arrive en médecine. Les données textuelles sont faciles à contrôler, à reproduire, à transmettre, à corriger, et se prêtent volontiers à la répétition et aux variations des expériences. Elles sont exemptes de filtrage sélectif et subjectif, et la conscience du chercheur intervient peu à l’entrée. Enfin et surtout les textes sont immédiatement interprétables, sans le truchement des machines. La lecture et la connaissance du texte sont des garants contre les calculs aberrants et les manœuvres avortées. La conscience a au moins une idée de l’ordre de grandeur des résultats attendus et peut les rejeter s’ils sont exagérément erronés ou délibérément triviaux, alors que d’autres disciplines travaillent sans vision directe et se trouvent liées aux instruments, sans possibilité de récuser leur témoignage.Ce qui est un avantage est aussi un inconvénient. Puisqu’en matière littéraire ou linguistique, on peut se débrouiller sans appareillage, pourquoi s’encombrer de méthodes indirectes et grossières qui obscurcissent l’évidence ou brutalisent les nuances. Pour beaucoup d’esprits, le refus d’accueillir les méthodes quantitatives est une manière de réserver un espace de liberté pour la conscience individuelle. Qu’il y ait au moins un domaine préservé, une réserve naturelle comme il y des parcs du même nom pour la sauvegarde des paysages, un refuge contre l’invasion technologique, où puissent vivre et subsister les disciplines menacées : l’art, le langage, la philosophie, la religion, la musique, la cuisine…Là s’arrête notre plaidoirie à charge et à décharge. La défense et illustration de la statistique ne passe pas par des discours mais par des exemples. Nous nous proposons d’en donner quelques-uns.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Exporter en