Lexique et classement en parties du discours dans ORFÉO

Fiche du document

Date

2020

Discipline
Type de document
Périmètre
Langue
Identifiant
Source

Langages

Collection

Cairn.info

Organisation

Cairn

Licence

Cairn




Citer ce document

José Deulofeu et al., « Lexique et classement en parties du discours dans ORFÉO », Langages, ID : 10670/1.dbtr9h


Métriques


Partage / Export

Résumé Fr En

L’article présente les principes et les critères qui ont présidé à l’élaboration de la table des parties du discours et à l’organisation du lexique correspondante, mis en œuvre dans l’analyse syntaxique automatique du corpus orféo. La comparaison est établie avec le Lexique des Formes Fléchies du Français ( lefff) utilisé dans d’autres outils de traitement automatique du langage. Les enjeux linguistiques et informatiques sont abordés. Un développement particulier est consacré au traitement des locutions ou expressions multi-mots. Des perspectives d’amélioration sont envisagées.

The paper discusses the principles and criteria used in elaborating the POS tagset and the structure of the corresponding lexicon at use for the automatic parsing of the orféo corpus. This architecture is compared with the current Lexique des Formes Fléchies du Français ( lefff) dictionary, available under open source license. The linguistic and natural language processing challenges are dwelled on. A specific attention is devoted to the processing of multiword expressions. Some ways of improvement of the system are provided.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en