Corpus Malherbe

Fiche du document

Date

30 mai 2023

Discipline
Type de document
Langue
Identifiant
  • 11403/MALHERBE
Source

ORTOLANG

Collection

Ortolang

Organisation

Équipex ORTOLANG

Licences

free_for_non_commercial_use , Libre sans utilisation commerciale , Free for non commercial use , Licence Creative Commons Attribution - Pas d'Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International




Citer ce document

« Corpus Malherbe », ORTOLANG


Partage / Export

Résumé 0

Le corpus Malherbe est un corpus de textes versifiés du XVIIe au XXe siècle.Ce corpus au format XML-TEI a été préparé dans le cadre d'un projet de recherchedu laboratoire CRISCO codirigé par Éliane Delente et Richard Renault et consacréà l'analyse automatique de la métrique des textes versifiés.L'analyse automatique porte sur :l'identification des noyaux syllabiquesle traitement des "e" instablesle traitement des diérèsesle calcul de la longueur métriquela détermination du profil métrique et le calcul du mètre des versl'identification des rimes et des schémas de rimesla détermination des formes strophiquesl'identification de la forme globale (forme fixe ou autre)l'identification de la PGTC et calcul de l'extension des rimesl'évaluation de la "qualité" des rimesle traitement statistique de la ponctuation (ponctuométrie)Le corpus analysé est visible sur le site web du projet :https://crisco4.unicaen.fr/verlaine/Les textes de ce corpus constituent la partie principale d'un corpus plus vaste (Corpus Malherbə)disponible sur le serveur Git de l'université de Caen :https://git.unicaen.fr/malherbe/corpusTous les textes mis à disposition sont hors droits et sous licence Creative Commons CC-BY-NC-SA.Dénombrement du corpus (décembre 2022) :141 auteurs482 recueils de poésies ou pièces de théâtre19 841 poèmes128 pièces de théâtre1 041 389 vers

document thumbnail

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en