Coreference resolution for spoken French

Traitement automatique du langage naturel Formats d’annotation Corpus Ressources annotées Apprentissage artificiel Réseaux de neurones artificiels Coréférence Anaphore

Sujets proches Fr

Chaînes mécaniques

Citer ce document

Loïc Grobol, « Reconnaissance automatique de chaînes de coréférences en français parlé », HAL-SHS : linguistique, ID : 10670/1.d83tj1

Partage / Export

Résumé En Fr

Une chaîne de coréférences est l’ensemble des expressions linguistiques — ou mentions — qui font référence à une même entité ou un même objet du discours. La tâche de reconnaissance des chaînes de coréférences consiste à détecter l’ensemble des mentions d’un document et à lepartitionner en chaînes de coréférences. Ces chaînes jouent un rôle central dans la cohérence des documents et des interactions et leur identification est un enjeu important pour de nombreuses autres tâches en traitement automatique du langage, comme l’extraction d’informations ou la traduction automatique. Des systèmes automatiques de reconnaissance de chaînes de coréférence existent pour plusieurs langues, mais aucun pour le français ni pour une langue parlée.Nous nous proposons dans cette thèse de combler ce manque par un système de reconnaissance automatique de chaînes de coréférences pour le français parlé. À cette fin, nous proposons un système utilisant des réseaux de neurones artificiels et ne nécessitant pas de ressources externes.Ce système est viable malgré le manque d’outils de prétraitements adaptés au français parléet obtient des performances comparable à l’état de l’art. Nous proposons également des voies d’amélioration de ce système, en y introduisant des connaissances issues de ressources et d’outilsconçus pour le français écrit. Enfin, nous proposons un nouveau format de représentation pour l’annotation des chaînes de coréférences dans des corpus de langues écrites et parlées et en nous en donnons un exemple en proposant une nouvelle version d’ANCOR — le premier corpus de français annoté en coréférence.

Coreference resolution for spoken French Reconnaissance automatique de chaînes de coréférences en français parlé En Fr

Fiche du document

Mots-clés En Fr

Sujets proches Fr

Citer ce document

Métriques

Partage / Export

Résumé En Fr

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en