A French Corpus Annotated for Multiword Nouns

Fiche du document



Type de document

Archives ouvertes



Citer ce document

Eric Laporte et al., « A French Corpus Annotated for Multiword Nouns », HAL-SHS : linguistique, ID : 10670/1.cqck4p


Partage / Export

Résumé En Fr

This paper presents a French corpus annotated for multiword nouns. This corpus is designed for investigation in information retrieval and extraction, as well as in deep and shallow syntactic parsing. We delimit which kind of multiword units we targeted for this annotation task; we describe the resources and methods we used for the annotation; and we briefly comment on the results. The annotated corpus is available at http://infolingu.univ-mlv.fr/ under the LGPLLR license.

Cet article présente un corpus du français muni d'annotations sur les noms composés. Ce corpus est conçu pour la recherche sur l'extraction d'informations ainsi que sur l'analyse syntaxique superficielle ou profonde. Nous délimitons quels types de mots composés nous avons ciblés pour cette tâche d'annotation ; nous décrivons les ressources et les méthodes que nous avons utilisées pour l'annotation ; et nous commentons brièvement les résultats. Le corpus annoté est disponible sur http://infolingu.univ-mlv.fr/ sous licence LGPLLR.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en