Comment visualiser la polysémie évolutive sur la base des entrées historiques du TLFi

Fiche du document

Date

11 mars 2023

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

http://creativecommons.org/licenses/by-nc-sa/




Citer ce document

Justine Reynaud et al., « Comment visualiser la polysémie évolutive sur la base des entrées historiques du TLFi », HAL-SHS : linguistique, ID : 10670/1.fsc1ej


Métriques


Partage / Export

Résumé Fr

Les seize volumes du Trésor de la Langue Française, le dictionnaire de langue le plus riche de toute l’histoire de la lexicographie du français, ont été publiés par l’Institut National de la Langue Française (INaLF, Nancy, CNRS et DGLF) entre 1971 et 1994. Dès la parution du dernier volume, l’informatisation du dictionnaire a été engagée par rétroconversion de l’édition papier (l’édition électronique du Grand Robert datait déjà de 1985) et poursuivie à partir du début du 21e siècle par le laboratoire qui a succédé à l’INALF, l’ATILF (Analyse et Traitement Informatique de la Langue Française). Les articles du TLFi se composent d’une entrée lexicographique, de données phonétiques, orthographiques et statistiques, à partir de la base de données textuelles FRANTEXT constituée simultanément, et d’une entrée « Étymologie et histoire ». Les entrées lexicographiques ont bénéficié d’une informatisation fonctionnelle (attribuant une fonction à chaque segment et permettant ainsi tout un jeu de recherches transversales), mais l’ATILF a renoncé à en faire de même pour les entrées historico-étymologiques (H-É), sans doute avec la conviction que le formatage de ces entrées était trop hétérogène, et s’est contenté d’une informatisation formelle, c’est-à-dire limitée à la délimitation des entrées et au format typographique. De ce fait, il est actuellement impossible de pratiquer sur les entrées H-É des recherches transversales similaires à celles que permettent les entrées lexicographiques.Le projet qui sera exposé le 11 mars vise à convertir l’essentiel des données fournies par les entrées H-É du TLFi dotées d’une « polysémie évolutive » (± 20 000 sur un total de ± 49 000) dans un format tabulaire, de leur associer un graphe historique (arborescent) et de publier pour chacune de ces entrées un couple graphe-tableau historique dans le cadre des éditions électroniques du CNRTL (Centre National de Ressources Textuelles et Lexicales, CNRS). À terme, la base de données ainsi constituée devrait permettre au moins certaines recherches transversales élémentaires.La présentation des étapes successives de ce projet sera effectuée pour sa dimension linguistique par Jacques François (CRISCO, Caen) et pour sa dimension informatique par Justine Reynaud (GREYC, Caen). La modélisation graphique du contenu des entrées H-É a été engagée par Triss Jacquiot (GREYC, 1er semestre 2022) et poursuivie par Laurette Chardon (CRISCO) depuis lors.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en