Classification automatique de questions spontanées vs. préparées dans des transcriptions de l'oral

Fiche du document

Date

2022

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess




Citer ce document

Iris Eshkol-Taravella et al., « Classification automatique de questions spontanées vs. préparées dans des transcriptions de l'oral », HAL-SHS : linguistique, ID : 10670/1.giun6i


Métriques


Partage / Export

Résumé Fr

Ce travail a pour objectif de développer un modèle linguistique pour classifier automatiquement des questions issues de transcriptions d’enregistrements provenant des corpus ESLO2 et ACSYNT en deux catégories "spontané" et "préparé". Avant de procéder au traitement automatique, nous proposons une liste de critères définitoires et discriminants permettant de distinguer les questions parmi d’autres énoncés. Les expériences basées sur des méthodes d’apprentissage supervisé sont réalisées selon une classification multiclasse comprenant les catégories "spontané", "préparé" et "non-question" et selon une classification binaire incluant les catégories "spontané" et "préparé" uniquement. Les meilleurs résultats pour les méthodes traditionnelles d’apprentissage automatique sont obtenus avec une régression logistique combinée aux critères linguistiques significatifs uniquement (F-score de 0.75). Pour finir, nous mettons en parallèle ces résultats avec ceux obtenus en utilisant des techniques d’apprentissage profond.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en