Un exemple de corpus annoté en diachronie longue : le corpus Democrat, enjeux et exploitations

Fiche du document

Date

13 octobre 2022

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes




Citer ce document

Julie Glikman et al., « Un exemple de corpus annoté en diachronie longue : le corpus Democrat, enjeux et exploitations », HAL-SHS : linguistique, ID : 10670/1.f0473s


Métriques


Partage / Export

Résumé Fr

Le corpus DEMOCRAT, constitué dans le cadre du projet ANR de même nom , dont il constitue l’un des livrables, est un corpus de textes annotés en chaînes de référence. Chaque élément référentiel (un ‘maillon’) est indiqué par un identifiant rapportant à son référent, ce qui permet la création d’une chaîne rassemblant toutes les mentions d’un même référent. En outre, le corpus bénéficie également d’une annotation en partie du discours. Ce corpus a déjà fait l’objet de plusieurs exploitations. À l’occasion de ce colloque, nous souhaitons mettre en avant les défis méthodologiques en jeu lors de la constitution d’un tel corpus. Nous montrerons ainsi que, malgré les difficultés inhérentes à un tel projet, les exploitations du corpus Democrat en diachronie longue permettent d’obtenir des résultats convaincants.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en