2016
info:eu-repo/semantics/OpenAccess
Dominique Longrée et al., « La contribution des études latines à la linguistique quantitative francophone : de la lemmatisation à la grammaticométrie et à la topologie textuelle. », HAL-SHS : linguistique, ID : 10670/1.0lpw37
Dans ce panorama sur la linguistique quantitative en France, nous voudrions mettre ici le focus sur les travaux suscités par les corpus latins. L’objectif de notre contribution sera de montrer en quoi le traitement automatique et statistique du latin a constitué un apport original et majeur aux études de linguistique quantitative et sera d’analyser les fondements épistémologiques de cet apport. Pour ce faire, nous serons obligés de sortir des frontières de l’hexagone et de faire un excursus jusqu’en Belgique, puisque le développement des études quantitatives sur les textes latins est franco-belge et repose presque entièrement sur les ressources constituées, à partir de 1961, par le LASLA, Laboratoire d’Analyse Statistique des Langues Anciennes de l’Université de Liège . Nous insisterons d’abord sur le rôle de la lemmatisation, en montrant comment cette simple opération d’abstraction et de regroupement a permis de donner corps à d’autres unités d’analyse, plus ou moins complexes ; nous évoquerons ensuite l’impact de la souplesse de l’ordre des mots latins sur les problématiques et sur les traitements ; enfin, nous évoquerons l’évolution des outils logiciels et l’adaptation nécessaire des méthodes de recherche automatique et de traitement quantitatif induites par les approches spécifiques de ces corpus latins.