1986
Copyright PERSEE 2003-2023. Works reproduced on the PERSEE website are protected by the general rules of the Code of Intellectual Property. For strictly private, scientific or teaching purposes excluding all commercial use, reproduction and communication to the public of this document is permitted on condition that its origin and copyright are clearly mentionned.
André Salem, « Segments répétés et analyse statistique des données textuelles », Histoire & Mesure, ID : 10.3406/hism.1986.1518
André Salem. Segments répétés et analyse statistique des données textuelles. La méthode des segments répétés permet de repérer dans les textes que l'on analyse de nombreuses unités composées de plusieurs formes répétées dans le même ordre à différents endroits du corpus. Certaines de ces unités s'avèrent être fortement récurrentes. L'analyse des voisinages récurrents permet d'appliquer aux segments répétés les méthodes statistiques utilisées pour analyser la distribution des formes simples. Les résultats obtenus sur les formes sont alors complétés par des données du même ordre calculées à partir des segments. Certains segments mis en évidence sont composés de formes dont la distribution dans le corpus est très régulière. Pour ces associations l'indexation directe des segments répétés se révèle donc indispensable. Enfin des typologies obtenues à partir des segments répétés permettent d'étudier directement l'évolution du stock « segmentai » au fil du corpus. Ces résultats, complètent, de manière intéressante, ceux qu'on obtient à partir des formes simples.