Policycorpus XL: An Italian Corpus for the detection of Hate Speech Against Politics

Fiche du document


20 octobre 2022


OpenEdition Books




https://creativecommons.org/licenses/by-nc-nd/4.0/ , info:eu-repo/semantics/openAccess

Citer ce document

Fabio Celli et al., « Policycorpus XL: An Italian Corpus for the detection of Hate Speech Against Politics », Accademia University Press, ID : 10.4000/books.aaccademia.10505


Partage / Export

Résumé En It

In this paper we present a large corpus of Twitter data in Italian, manually annotated with hate speech in the political domain. Given the rising amount of hate messages in the public debate, we believe that this is a valuable resource for the NLP community. Here we describe the collection of data and test some baseline with classification algorithms.

In questo articolo presentiamo un corpus di dati Twitter di dominio politico in Italiano, annotati manualmente con etichette di odio. Dato il dilagare di messaggi di odio nel diabattito pubblico, crediamo che questa risorsa sia preziosa per la comunità di ricerca nell’elaborazione automatica del linguaggio. Qui viene descritta la raccolta dei dati e vengono applicati algoritmi di classificazione per effettuare la valutazione di base.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en