Développement d'un module de génération de paraphrases pour la data augmentation

Fiche du document

Date

10 septembre 2019

Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess



Sujets proches Fr

Métaphrase

Citer ce document

Sonia Ratsiandavana, « Développement d'un module de génération de paraphrases pour la data augmentation », DUMAS - Dépôt Universitaire de Mémoires Après Soutenance, ID : 10670/1.0bsb4j


Métriques


Partage / Export

Résumé En Fr

This paper summarizes the work completed during a six-month internship in the Research & Development team of Linagora. The aim of this project is to develop a paraphrasing tool able to expand the training datasets of the smart vocal assistant LinTO. We started by analyzing the existing commands in the original corpus : the recurrent syntactic structures and the paraphrasing mecanisms that can be applied to them. From these observations, we created a rule-based grammar to generate semantically and synctactically correct sentences.

Ce document résume 6 mois de travail au sein de l’équipe Recherche et Développement de Linagora Toulouse. Le but de ce projet était de développer un module de paraphrase permettant d’enrichir le corpus d’apprentissage de l’agent conversationnel LinTO. Nous avons commencé par analyser les différentes commandes présentes dans notre corpus initial : les structures syntaxiques récurrentes et les mécanismes de paraphrasage qu’on peut leur appliquer. À partir de ces observations, nous avons créé une grammaire à base de règles pour générer plusieurs paraphrases d’une commande en entrée.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Exporter en