11 septembre 2020
info:eu-repo/semantics/OpenAccess
Nadezhda Rumiantceva, « Stratégies d'enrichissement sémantique d'analyse d'opinions : contributions logicielles et linguistiques », DUMAS - Dépôt Universitaire de Mémoires Après Soutenance, ID : 10670/1.vi2w0q
Depuis 2019, Eloquant développe un nouvel outil d’extraction d’opinions, combinant apprentissage automatique et règles linguistiques. La première version ayant une performance inégale selon les entités à relever, et commettant fréquemment des erreurs dans l’identification des opinions, l’équipe Sémantique a envisagé de faire appel à des stratégies d’étiquetage complémentaires.Nous avons développé une deuxième version du projet d’analyse d’opinions, en utilisant une approche permettant de concilier l’apprentissage automatique et l’intégration des annotations sémantiques. Pour l’apprentissage automatique, nous avons reconstitué les corpus d’entraînement, afin de les rendre plus équilibrés. Par la suite, en analysant les erreurs de la version précédente du projet, nous avons adapté les règles symboliques et en avons créé de nouvelles pour apporter le plus d’améliorations possibles. Finalement, l’évaluation de la nouvelle version du projet d’analyse d’opinions nous a permis de démontrer la supériorité de ses performances par rapport à la première version.Nous avons également travaillé sur la détection de l’intensité pour l’analyse d’opinions. L’étude des ouvrages scientifiques et des désaccords entre les annotateurs des corpus nous a démontré la subjectivité de la notion en question. Nous avons tout de même entraîné plusieurs modèles basés sur différents corpus qui serviront comme base pour le projet en développement.Finalement, nous avons participé à plusieurs projets d’Eloquant, tels que l’analyse des conversations téléphoniques, l’enrichissement sémantique pour une Maison de Luxe, la reconnaissance de noms de logiciels dans des verbatims courts et la post-édition des verbatims traduits du français vers le russe. Ces projets nous ont aidés à nous familiariser avec les technologies utilisées au sein de l’entreprise.