Gallicagram : les archives de presse sous les rotatives de la statistique textuelle

Lexico-statistique Statistiques textuelles Fréquence (linguistique) Lexicostatistique Mots, Fréquence des Lexicologie quantitative Lexicométrie Fréquence des mots Statistique textuelle Textométrie Fréquence lexicale Statistiques lexicales

Citer ce document

Benoît de Courson et al., « Gallicagram : les archives de presse sous les rotatives de la statistique textuelle », Corpus, ID : 10.4000/corpus.7944

Partage / Export

Résumé Fr En

Gallicagram est un nouvel outil de lexicométrie, fondé notamment sur les archives océrisées de la Bibliothèque nationale de France et sur celles du journal Le Monde ; il dénombre dans le corpus choisi et pour une période donnée les occurrences d’un mot ou d’un syntagme, et offre différents modes de visualisation des données obtenues. Ce logiciel mérite à plusieurs titres d’être investi par les chercheurs : outre le volume des données qu’il exploite, suffisant pour fonder des analyses lexicométriques depuis le XVIIe siècle jusqu’à nos jours, Gallicagram a sur son concurrent immédiat, Ngram Viewer, l’avantage d’une transparence très supérieure et d’une structure plus constante au cours du temps. L’article présente Gallibase, son extension qui lui applique les outils de la statistique textuelle – en particulier les analyses factorielles et arborées. Il illustre son potentiel et insiste sur l’intérêt spécifique des corpus de presse, qui permettent des études sur périodes courtes.

Gallicagram : les archives de presse sous les rotatives de la statistique textuelle

Fiche du document

Mots-clés Fr En

Sujets proches En Es Fr

Citer ce document

Métriques

Partage / Export

Résumé Fr En

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en