The text is changing ...Textometric analysis of reports presented during the congresses of the Chinese Communist Party(1982-2017) Le texte se transforme...Analyse textométrique des rapports d'ouverture présentés aux congrès du Parti Communiste Chinois (1982-2017) En Fr

Fiche du document

Date

4 mai 2019

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess



Citer ce document

André Salem et al., « Le texte se transforme...Analyse textométrique des rapports d'ouverture présentés aux congrès du Parti Communiste Chinois (1982-2017) », HAL-SHS : histoire, philosophie et sociologie des sciences, ID : 10670/1.gf3yd8


Métriques


Partage / Export

Résumé En Fr

Speeches produced by political parties are often considered as "repetitive and non-informative". Yet, over time such speeches can yield extremely valuable information as we show here by applying statistical methods to Chronological text series. When examined, a compilation of reports presented during the eight congresses of the Chinese Communist Party (CCP), held between 1982 and 2017 (§1), reveals variations of vocabulary over time in the form of Textual highlights which point out key moments in lexical evolution (§2). Textometric analysis provides a critical perspective towards the tokenization of texts into words as operated by automatic tokenizers of Chinese. More efficient methods for the observation of lexical variations, linked to the political changes in progress, are then presented (§3). Finally, a constant evolution of the enunciation style during the observed period, is highlighted (§4). Such evolution is particularly relevant to frequent word variations, which are often discarded by discourse researchers, under pretext that they convey less information. The methodology described in this study is applicable to a very wide range of textual corpora.

Les discours produits par les partis politiques sont souvent considérés comme "répétitifs et dépourvus de caractère informatif". Nous montrons, sur l'exemple d'une série textuelle chronologique, que ces corpus peuvent au contraire contenir des renseignements extrêmement précieux sur l'évolution des textes dans le temps. Notre étude concerne une série de rapports présentés durant les huit congrès du Parti Communiste Chinois (PCC), survenus entre 1982 et 2017 (§1). Les méthodes de la veille textuelle textométrique mettent en évidence des variations du vocabulaire au fil du temps et des moments-clés dans cette évolution (§2). Le dépouillement textométrique permet de porter un regard critique sur la segmentation des textes en mots, opérée par les segmenteurs automatiques du chinois, et de présenter des méthodes plus efficaces pour l'observation des variations lexicales, liées aux changements politiques en cours (§3). Durant la période observée, le style d'énonciation subit une évolution profonde et continue. Cette dernière transformation concerne particulièrement les variations de la fréquence de "mots-outils", souvent négligés dans les recherches quantitatives sur le discours sous le prétexte qu'ils véhiculeraient moins d'information (§4). L'ensemble des méthodes décrites dans la présente étude est applicable à une très large gamme de corpus textuels.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en