25 juin 2024
info:eu-repo/semantics/OpenAccess
Sandrine Ollinger et al., « Segmentation en phrases : ouvrez les guillemets sans perdre le fil », HAL SHS (Sciences de l’Homme et de la Société), ID : 10670/1.6e6c92...
Cet article présente une cascade de graphes pour la segmentation en phrases de documents XML. Notre proposition prévoit une inclusion de phrases pour les cas introduits par des guillemets et tirets et porte également une attention particulière aux situations d’incises introduites par des parenthèses et des listes introduites par des deux-points. Nous présentons le fonctionnement de l’outil et comparons les résultats obtenus à ceux disponibles en 2019 sur le même jeu de données, ainsi qu’une évaluation des performances du système sur un corpus test.