http://creativecommons.org/licenses/by-nc-sa/ , info:eu-repo/semantics/OpenAccess
Laurette Chardon et al., « La polysémie évolutive du lexique français (12e -20e siècle): projet d'informatisation fonctionnelle et de modélisation graphique des entrées historiques du TLFi », HAL-SHS : linguistique, ID : 10670/1.3yw07x
Cette étude est consacrée à l’exploration de la notion de « polysémie évolutive », qui ne pointe pas sur un type particulier de polysémie lexicale, mais sur l’évolution de l’éventail des sens véhiculés par un vocable au fil des siècles, essentiellement par le biais d’extensions de sens, car le déclin d’une partie d’entre eux se laisse difficilement documenter. L’accrétion progressive des sens des vocables polysémiques en français contemporain a fait l’objet d’études approfondies depuis plus d’un siècle, depuis les travaux d’A. Darmesteter (1887) jusqu’au dictionnaire historique d’A. Rey (1992) en passant par le FEW de W. von Wartburg (depuis 1929) et les entrées « Étymologie et Histoire » du Trésor de la Langue Française rédigées dans les trois dernières décennies du 20 e siècle sur cette base. L’informatisation du TLF a donné lieu à deux niveaux de traitement : formel et fonctionnel (les différentes polices de caractères et leur fonction contextuelle) pour les entrées principales, mais seulement formel pour les entrées historico-étymologiques, ce qui interdit toute enquête transversale. L’objet de notre étude, assise sur trois publications antérieures (François 2020a, 2020b, 2021) est double. Il s’agit d’abord de compléter le traitement formel de ces entrées en attribuant une fonction lexicographique diachronique à différents types de segments, notamment les identifiants des multiples rubriques (jusqu’à 154 pour le verbe tenir), la datation de la première attestation de chaque type d’emploi, les collocations en cause, les définitions, etc.). Ensuite ces classes de données sont rassemblées dans un tableau de conversion graphique, lequel permet de construire automatiquement un graphe historique arborescent pour les ±29 000 entrées polysémiques (sur ±49 000 au total). Le but de cette modélisation graphique est de permettre la comparaison entre des types de profils historiques dont la dernière section de l’article donne une illustration en combinaison avec l’exploitation diachronique de FRANTEXT du 12 e siècle à nos jours.Table des matières : 1 La phase préliminaire du projet (2020–21) : deux questionnements envoie de convergence1.1 Techniques de visualisation de la diversification des sens lexicaux1.2 Deux techniques en concurrence 2 Le projet d’informatisation fonctionnelle et de modélisation graphique des entrées historico-étymologiques [H-É] du TLFi 3 La microstructure des articles du TLFi et de leur entrée H-É 3.1 Articles, entrées, dégroupements et regroupements 3.2 Comparaison entre les deux entrées lexicographiques du H-É du n. m. cœur 4 L’éventail typographique des entrées H-É 4.1 La fonction variable des types de caractères selon qu’ils figurent entre ouen dehors de parenthèses courbes 4.2 La dissociation des deux sous-entrées historique et étymologique 5 Le traitement informatique des entrées H-É au format XML 5.1 Structure générale des fichiers 5.1.1 Les principales balises XML 5.2 La balise 5.3 L’algorithme de création des données tabulaires 5.3.1 L’algorithme général 5.3.2 L’extraction des niveaux et des rubriques (proc 2) 5.3.3 L’extraction des niveaux et des rubriques (proc 3) 5.3.4 Identification de la définition et des collocations d’une rubrique (proc 4) 5.3.5 Séparation des parties Histoire et Étymologie (proc 5) 6 Bilan d’étape et illustration d’un champ d’étude dérivé 6.1 La poursuite du chantier en cours 6.2 Test de l’hypothèse d’une corrélation entre le volume de l’entrée H-É d’unvocable en nombre de rubriques et sa fréquence relative dans FRANTEXTau fil des siècles