Le projet ConDÉ : présentation. Les défis d’un corpus de textes en diachronie longue

Fiche du document

Date

26 novembre 2019

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes



Citer ce document

Mathieu Goux et al., « Le projet ConDÉ : présentation. Les défis d’un corpus de textes en diachronie longue », HAL-SHS : linguistique, ID : 10670/1.n0ttjk


Métriques


Partage / Export

Résumé Fr

Le projet RIN CONDÉ (CONstitution d’un Droit europÉen : six siècles de coutumiers nor­mands), financé par la région Normandie, se consacre à l’histoire de la Coutume de Normandie, jusqu’à présent surtout étudiée selon les circonstances de sa constitution, du XIIIe au XVIIIe siècles. Ce projet propose de considérer ces textes comme des témoignages précieux relatifs à l’histoire du droit, notamment dans les rapports à la jurisprudence et au pouvoir temporel; du point de vue historique, le travail fait sur les versions et le nombre de manuscrits propose un panorama de la structuration de l’écrit et de son économie dans le domaine juridique; enfin, ce matériau abondant est une source précieuse quant à une analyse linguistique diachronique, par l’intermédiaire de textes précisément datés et localisés.CONDÉ édifie une base de données interrogeable en ligne, accessible à la communauté des chercheurs comme des professionnels du droit ou des enseignants de l’ancienne langue, reflétant l’évolution et l’élaboration du droit en Normandie. Ce projet demande à surmonter un certain nombre de difficultés : en amont, par l’inventaire et la sélection des coutumiers représentatifs; puis par les défis qu’engagent la transcription, la numérisation et l’étiquetage syntaxique des textes; enfin, par les diffusions potentielles d’un tel corpus, jamais envisagé sous cet angle jus­qu’à présent.Nous présenterons notre corpus sous ses aspects techniques, en nous inscrivant dans le champ contemporain des Humanités Numériques d’une part, de la linguistique de corpus de l’autre, et nous présenterons la façon dont nous avons retranscrit la spécificité de ce corpus, enrichi d’un appareillage scientifique impliquant (i) une numérisation et une transcription de ces différents témoins; (ii) un système de renvoi et de navigation permettant un accès intelligent à leurs diffé­rents contenus; (iii) une lemmatisation et un étiquetage morphosyntaxique, permettant de faire des recherches fines au sein des textes.Lire la suite du résumé dans le livret des résumés disponible sur : https://jlc2019.sciencesconf.org/data/pages/JLC_Xe.pdf. (p. 51 à 54)

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en