28 novembre 2019
info:eu-repo/semantics/OpenAccess
Ilaine Wang et al., « Combiner parseur automatique et révision manuelle pour la constitution d'un corpus arboré de parole spontanée : retour d'expérience sur le corpus ODIL_syntaxe », HAL-SHS : linguistique, ID : 10670/1.ol679i
Cet article présente l'utilisation d'une plateforme d'annotation syntaxique (Contemplata) qui intègre un parseur pour annoter automatiquement des corpus écrits ou oraux puis permettre leur révision manuelle par un·e expert·e, afin de limiter son travail d'annotation. Dans le cadre du projet ODIL, cet outil a permis de réaliser un corpus de français parlé spontané annoté en arbres de constituants, ceci dans la perspective d'une annotation en temporalité. Nous présentons ici la démarche mise en œuvre pour l'annotation ainsi que les conventions d'annotation, et proposerons une démonstration de l'outil.