9 mai 2023
free_use , Libre , Free , Licence Creative Commons - Attribution 4.0 International
Pietrandrea Paola et al., « CORPUS MIGR-TWIT. Tweets-migr de la gauche politique française. », ORTOLANG
Le Corpus FR-L-MIGR-TWIT fait partie du Corpus MIGR-TWIT, corpus diachronique de tweets bilingue sur le sujet de l'immigration en Europe. Dans le cadre du projet de recherche OLiNDiNUM (Observatoire LINguistique du DIscours NUMérique), le Corpus MIGR-TWIT est créé en ayant pour objectif d'étudier l'évolution du discours public sur l'immigration en Europe parcourant la période entre 2011 et 2022. Les deux premières composantes représentent les discours de la droite politique sur l'immigration en France et au Royaume-Uni. Le Corpus FR-L-MIGR-TWIT représente les discours de la gauche politique française sur le sujet. En nous servant du Twitter API v2 Academic Research, les Tweets contenant au moins une occurrence du lexique relatif à l’immigration (c'est-à-dire le lexique dérivé de la racine latine -migr-) sont automatiquement extraits de 23 comptes Twitter des figures et partis politiques de la gauche française. Contenu La version téléchargeable du Corpus FR-L-MIGR-TWIT-2011-2022 contient au total 32 fichiers au format CSV (format tabulaire de données). Le corpus se présente en deux versions, simplifiée et complète en matière de métadonnées. La version simplifiée s’intitule FR-L-MIGR-TWIT-2011-2022.csv, et contient les données suivantes : l'identifiant, le texte, la date de publication et le nom d'utilisateur du Tweet (correspondant respectivement aux quatre éléments de l'en-tête de data__id, data__text, data__created_at, author__username). La version complète, en plus de ces quatre données de base, contient toutes les métadonnées du Tweet, notamment les nombres de Retweets, de J'aime, de réponses et de Citations, etc. Cette version est disponible sous forme d’un seul fichier qui s’intitule FR-L-MIGR-TWIT-2011-2022_meta.csv. Cette version complète est également disponible en 7 fichiers dans le dossier nommé FR-L-MIGR-TWIT-YEAR_meta, correspondant aux années de la dernière douzaine d’années (e.g. FR-L-MIGR-TWIT-2011-2016_meta.csv, FR-L-MIGR-TWIT-2017_meta.csv, ainsi de suite) ainsi qu’en 23 fichiers dans le dossier nommé FR-L-NAME-MIGR-TWIT_meta, correspondant à chaque figure politique concernée (p.ex. FR-L-Arthaud-TWIT_meta.csv). Le fichier zippé intitulé FR-L-MIGR-TWIT-2011-2022_meta.zip contient les fichiers de chaque figure/parti politique séparés en fonction des années.Ci-dessous sont détaillées les informations sur le CORPUS FR-L-MIGR-TWIT-2011-2022. Date de création (année-mois-jour) : 2023-04-18 Langue : français Portée et taille : 23 comptes Twitter ; 5,636 Tweets ; 169,818 mots Période de la collecte des données : début=2011-01-01 ; fin=2022-06-30 Mot-clé : mots dérivés de la racine latine “migr” de migrare Composition du corpus : Figure/parti politique Type du représentant Nom d'utilisateur Tweets-migr 1 Adrien Quatennens PERSONNE (M) @AQuatennens 315 2 Alexis Corbière PERSONNE (M) @Alexiscorbiere 209 3 Anne Hidalgo PERSONNE (F) @Anne_Hidalgo 801 4 Arnaud Montebourg* PERSONNE (M) @montebourg 7 5 Benoît Hamon PERSONNE (M) @benoithamon 172 6 Christiane Taubira PERSONNE (F) @ChTaubira 11 7 Clémentine Autain PERSONNE (F) @Clem_Autain 102 8 Danièle Obono PERSONNE (F) @Deputee_Obono 415 9 Esther Benbassa** PERSONNE (F) @EstherBenbassa 936 10 François Hollande PERSONNE (M) @fhollande 28 11 François_Ruffin PERSONNE (M) @Francois_Ruffin 19 12 Jean-Luc Mélenchon PERSONNE (M) @JLMelenchon 240 13 Manon Aubry PERSONNE (F) @ManonAubryFr 182 14 Natalie Arthaud PERSONNE (F) @n_arthaud 165 15 Philippe Poutou PERSONNE (M) @PhilippePoutou 83 16 Raphael Glucksmann PERSONNE (M) @rglucks1 142 17 Yannick Jadot PERSONNE (M) @yjadot 374 18 Europe Écologie-Les Verts ORGANISATION @EELV 484 19 Gauche Républicaine et Socialiste ORGANISATION @Gauche_RS 73 20 Génération.s ORGANISATION @GenerationsMvt 165 21 La France Insoumise ORGANISATION @FranceInsoumise 300 22 Parti Radical Gauche ORGANISATION @PartiRadicalG 37 23 Parti Socialiste ORGANISATION @partisocialiste 376 Les figures et partis politiques, classés par ordre alphabétique, sont sélectionnés selon quatre critères : (1) le nombre important de Tweets-migr, (2) l’affiliation politique, (3) l’eurodéputé.e ou (4) la/le candidat.e à l’Élection présidentielle au cours de la période entre 2011 et 2022. Ces quatre critères ne s’excluent pas mutuellement.Dans le cadre de la recherche doctorale (Jeon, S.), les corpus FR-L-MIGR-TWIT et FR-R-MIGR-TWIT sont compilés, annotés et analysés, dans une approche comparative et d'analyse de discours, en ayant pour objectifs d'étudier la construction sémantique du lexique-migr à travers la période du quinquennat entre 2017 et 2022.*Pour l’année de 2019, un seul tweet-migr a été récupéré à partir du twitto @montebourg. Or, s’agissant de la migration des abeilles, ce tweet est exclu de ses 7 tweets-migr recensés.**Le twitto @EstherBenbassa, dont la représentante est Esther Benbassa, sénatrice et ancien membre du parti Europe Écologie-Les Verts, est rajouté ultérieurement, suite à la prise en compte du fait que le nombre important de ses Tweets-migr ont été retweetés par le twitto @EELV. Le Corpus MIGR-TWIT consiste en trois sous-corpus, comptant un total de 23,869 Tweets et de 703,016 mots: Corpus FR-R-MIGR-TWIT-2011-2022 : corpus de tweets-migr de la droite politique française Corpus UK-R-MIGR-RA-TWIT-2011-2022 : corpus de tweets-migr de la droite politique britannique Corpus FR-L-MIGR-TWIT-2011-2022 : corpus de tweets-migr de la gauche politique française Financement: - Université de Lille, Projet d'Internationalisation 2021 - Université Franco-italienne / Università Italo Francese - Campus France (Partenariats Hubert Curien): Italie - PHC Galilée 2018-19 ; Bay-Bas - PHC Van Gogh 2018-19