30 mai 2023
free_for_non_commercial_use , Libre sans utilisation commerciale , Free for non commercial use , Licence Creative Commons Attribution - Pas d'Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International
« Corpus Malherbe », ORTOLANG
Le corpus Malherbe est un corpus de textes versifiés du XVIIe au XXe siècle.Ce corpus au format XML-TEI a été préparé dans le cadre d'un projet de recherchedu laboratoire CRISCO codirigé par Éliane Delente et Richard Renault et consacréà l'analyse automatique de la métrique des textes versifiés.L'analyse automatique porte sur :l'identification des noyaux syllabiquesle traitement des "e" instablesle traitement des diérèsesle calcul de la longueur métriquela détermination du profil métrique et le calcul du mètre des versl'identification des rimes et des schémas de rimesla détermination des formes strophiquesl'identification de la forme globale (forme fixe ou autre)l'identification de la PGTC et calcul de l'extension des rimesl'évaluation de la "qualité" des rimesle traitement statistique de la ponctuation (ponctuométrie)Le corpus analysé est visible sur le site web du projet :https://crisco4.unicaen.fr/verlaine/Les textes de ce corpus constituent la partie principale d'un corpus plus vaste (Corpus Malherbə)disponible sur le serveur Git de l'université de Caen :https://git.unicaen.fr/malherbe/corpusTous les textes mis à disposition sont hors droits et sous licence Creative Commons CC-BY-NC-SA.Dénombrement du corpus (décembre 2022) :141 auteurs482 recueils de poésies ou pièces de théâtre19 841 poèmes128 pièces de théâtre1 041 389 vers