BEL-RL-fr DBLE-LN-fr Fr En

Fiche du document

Date

19 juin 2024

Discipline
Type de document
Langue
Identifiant
  • 11403/EXAMPLES-LS-FR
Source

ORTOLANG

Collection

Ortolang

Organisation

Équipex ORTOLANG

Licences

free_use , Libre , Free , Licence Creative Commons - Attribution 4.0 International




Citer ce document

« BEL-RL-fr », ORTOLANG


Partage / Export

Résumé Fr En

Le corpus BEL-RL-fr est une distribution de la base de citations lexicographiques du Réseau Lexical du français (RL-fr), modèle formel du lexique du français contemporain en cours de construction. Sa réalisation s'inscrit dans le cadre des travaux sur les Systèmes Lexicaux menés sous la responsabilité d’Alain Polguère.Si vous désirez être informé de l'actualité concernant la distribution des données des Systèmes Lexicaux, inscrivez-vous sur la liste syslex-distr-atil en envoyant un courriel à l'adresse " target="_blank">sympa@services.cnrs.fr ayant pour objet subscribe syslex-distr-atilf lt;Votre prénomgt; lt;Votre nomgt; sans rien inscrire dans le corps du message. Vous recevrez alors un courriel vous invitant à confirmer votre demande.Statistiques :La version courante de BEL-RL-fr comporte :31 987citations53 013 segments textuels annotés en unité lexicale Bibliographie :Ollinger S., Polguère A. (2020a) « Distribution des Systèmes Lexicaux. Version 2.0 ». Rapport technique, ATILF CNRS, Nancy.Sandrine Ollinger et Denis Maurel. Segmentation en phrases : ouvrez les guillemets sans perdre le fil. Actes des 17e Journées internationales d’analyse statistique des Données Textuelles, 2024 à paraître.Lux-Pogodalla V. (2014) « Intégration relationnelle des exemples lexicographiques dans un réseau lexical ». Actes TALN (Traitement Automatique du Langage Naturel), Marseille, France, Juillet 2014.Heiden S., Magué J.-P., amp; Pincemin B. (2010). « TXM : Une plateforme logicielle open-source pour la textométrie – conception et développement ». JADT 2010 : 10th International Conference on the Statistical Analysis of Textual Data, Rome, Italie, Juin 2010.

This corpus called DBLE-LN-fr is the distribution of the lexicographical quotations of the French Lexical Network (fr-LN), a formal model of the lexicon of contemporary French presently under construction. It takes part in the research conducted on Lexical Systems at the ATILF laboratory – CNRS and Université de Lorraine – , under the supervision of Alain Polguère. Each example originates from one of the following sources: the textual database Frantext, the Web corpus frWaC, the journalistic corpus Est Républicain, OrthoCorpus, varied sources out of databases (Web, publication, audiovisual, conversation, mail, song).Some rare quotations were created by lexicographers.The corpus is sorted into sources, in an XML file format. Each quotation is represented by a citation, with its bibliographic reference.The bibliographic references include a date :date of publication (Frantext, Est Républicain, OrthoCorpus, publications hors corpus, support audiovisuel, chansons),date of consultation (Web),date of building up the corpus (frWac),creation date.Only 60 quotations predate 1950. They serve to illustrate lexical units that are now inactive as such, but formally included in polylexical units. The lexical entity occurrences inside are indicated by an element lt;seg/gt;. Each occurrence appears with several information: a unique identifier,the lexical status of the lexical entity,the part of speech of the lexical entity by means of an URI, which points to the fr-LN’s model of grammatical characteristics,a link to visualize the lexical entity.Some additional information is available in the header of each file.In that way, the DBLE-LN-fr is a manually annotated resource in lexical units.It’s possible to deduce the URI of a lexical unit from a link like this: ‘https://spiderlex.atilf.fr/fr/id/35415’ =gt; ‘ls:fr:node:35415’Statistics :The current version of DBLE-LN-fr includes :31,987 quotations53,013 text segments annotated in lexical unitsBibliography :Ollinger S., Polguère A. (2020a) « Distribution des Systèmes Lexicaux. Version 2.0 ». Rapport technique, ATILF CNRS, Nancy.Sandrine Ollinger et Denis Maurel. Segmentation en phrases : ouvrez les guillemets sans perdre le fil. Actes des 17e Journées internationales d’analyse statistique des Données Textuelles, 2024 à paraître.Lux-Pogodalla V. (2014) « Intégration relationnelle des exemples lexicographiques dans un réseau lexical ». Actes TALN (Traitement Automatique du Langage Naturel), Marseille, France, Juillet 2014.Heiden S., Magué J.-P., amp; Pincemin B. (2010). « TXM : Une plateforme logicielle open-source pour la textométrie – conception et développement ». JADT 2010 : 10th International Conference on the Statistical Analysis of Textual Data, Rome, Italie, Juin 2010.

document thumbnail

Sur les mêmes sujets

Sur les mêmes disciplines