From Cambridge to Pisa: A Journey into Cross-Lingual Dialogue Domain Adaptation for Conversational Agents

Fiche du document

Date

2022

Discipline
Périmètre
Langue
Identifiant
  • 20.500.13089/1dp6
Relations

Ce document est lié à :
https://hdl.handle.net/20.500.13089/1chx

Ce document est lié à :
https://doi.org/10.4000/books.aaccademia

Ce document est lié à :
info:eu-repo/semantics/altIdentifier/isbn/979-12-80136-94-7

Collection

OpenEdition Books

Organisation

OpenEdition

Licences

info:eu-repo/semantics/openAccess , https://creativecommons.org/licenses/by-nc-nd/4.0/


Sujets proches En

Dialog

Citer ce document

Tiziano Labruna et al., « From Cambridge to Pisa: A Journey into Cross-Lingual Dialogue Domain Adaptation for Conversational Agents », Accademia University Press


Partage / Export

Résumé En It

Domain and language shift are still major bottlenecks for a vast range of task-oriented dialogue systems. This paper focuses on data-driven models for dialogue state tracking, and builds on top of recent work on dialogue domain adaptation, showing that state-of-the-art models are very sensible to language shift obtained through automatic translation. Experiments show that combining training data for the two languages (English and Italian) is always beneficial, while combining domains does not increase performance. As a relevant side effect of our work, we present a new dataset for dialogue state tracking available for Italian, derived from MultiWOZ 2.3.

I cambiamenti di dominio e di lingua sono ancora uno dei maggiori ostacoli per una ampia classe di sistemi di dialogo task-oriented. Questo lavoro si focalizza su modelli derivati da dati per tracciare gli stati del dialogo, e prosegue lavori recenti su adattamento del dialogo al dominio, mostrando che i modelli allo stato dell’arte sono molto sensibili ai cambiamenti di lingua ottenuti tramite traduzione automatica. Gli esperimenti mostrano che combinando i dati di addestranmento per due lingue (inglese e italiano) e’ sempre vantaggioso, mentre la combinazione di dominii non migliora le prestazioni. Come importante conseguenza del lavoro, presentiamo il primo dataset per il tracciamento degli stati del dialogo disponile per l’italiano, derivato da MultiWOZ 2.3.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines