31 janvier 2024
Ce document est lié à :
info:eu-repo/semantics/reference/issn/1765-3126
Ce document est lié à :
info:eu-repo/semantics/reference/issn/1638-9808
info:eu-repo/semantics/openAccess , All rights reserved
Sophie Prévost et al., « Profiterole : un corpus morpho-syntaxique et syntaxique de français médiéval », Corpus, ID : 10.4000/corpus.8538
Le projet ANR Profiterole avait pour objectifs la constitution de ressources pour le français médiéval (9e-15e s.) : un corpus annoté en (morpho-)syntaxe et des lexiques, la conception d'analyseurs syntaxiques pour le français médiéval, le développement d’outils de diffusion et d’analyse textométrique de l’annotation syntaxique dans le contexte de la plateforme TXM, et, enfin, la modélisation de certains aspects syntaxiques de l’évolution du français. Nous commençons par décrire la constitution du corpus Profiterole en termes de choix de textes, genres et périodes et de types d’annotation. Puis nous présentons les modèles d’analyse syntaxique développés conjointement à la constitution du corpus, ainsi que la manière dont leurs prédictions ont été combinées pour assister la correction manuelle de l’annotation du corpus. Enfin, nous abordons les modalités de diffusion des données et modèles produits dans le cadre du projet avec un accent particulier sur l’intégration du corpus annoté à TXM, tant dans sa version en ligne accessible depuis le portail de la Base de français médiéval (BFM) que dans sa version pour ordinateur personnel, avec des exemples de requêtes CQP et TIGER facilitant l’exploration et l’analyse du corpus.