9 mai 2023

Résumé Fr En

Le Corpus FR-L-MIGR-TWIT fait partie du Corpus MIGR-TWIT, corpus diachronique de tweets bilingue sur le sujet de l'immigration en Europe. Dans le cadre du projet de recherche OLiNDiNUM (Observatoire LINguistique du DIscours NUMérique), le Corpus MIGR-TWIT est créé en ayant pour objectif d'étudier l'évolution du discours public sur l'immigration en Europe parcourant la période entre 2011 et 2022. Les deux premières composantes représentent les discours de la droite politique sur l'immigration en France et au Royaume-Uni. Le Corpus FR-L-MIGR-TWIT représente les discours de la gauche politique française sur le sujet. En nous servant du Twitter API v2 Academic Research, les Tweets contenant au moins une occurrence du lexique relatif à l’immigration (c'est-à-dire le lexique dérivé de la racine latine -migr-) sont automatiquement extraits de 23 comptes Twitter des figures et partis politiques de la gauche française. Contenu La version téléchargeable du Corpus FR-L-MIGR-TWIT-2011-2022 contient au total 32 fichiers au format CSV (format tabulaire de données). Le corpus se présente en deux versions, simplifiée et complète en matière de métadonnées. La version simplifiée s’intitule FR-L-MIGR-TWIT-2011-2022.csv, et contient les données suivantes : l'identifiant, le texte, la date de publication et le nom d'utilisateur du Tweet (correspondant respectivement aux quatre éléments de l'en-tête de data__id, data__text, data__created_at, author__username). La version complète, en plus de ces quatre données de base, contient toutes les métadonnées du Tweet, notamment les nombres de Retweets, de J'aime, de réponses et de Citations, etc. Cette version est disponible sous forme d’un seul fichier qui s’intitule FR-L-MIGR-TWIT-2011-2022_meta.csv. Cette version complète est également disponible en 7 fichiers dans le dossier nommé FR-L-MIGR-TWIT-YEAR_meta, correspondant aux années de la dernière douzaine d’années (e.g. FR-L-MIGR-TWIT-2011-2016_meta.csv, FR-L-MIGR-TWIT-2017_meta.csv, ainsi de suite) ainsi qu’en 23 fichiers dans le dossier nommé FR-L-NAME-MIGR-TWIT_meta, correspondant à chaque figure politique concernée (p.ex. FR-L-Arthaud-TWIT_meta.csv). Le fichier zippé intitulé contient les fichiers de chaque figure/parti politique séparés en fonction des années.Ci-dessous sont détaillées les informations sur le CORPUS FR-L-MIGR-TWIT-2011-2022. Date de création (année-mois-jour) : 2023-04-18 Langue : français Portée et taille : 23 comptes Twitter ; 5,636 Tweets ; 169,818 mots Période de la collecte des données : début=2011-01-01 ; fin=2022-06-30 Mot-clé : mots dérivés de la racine latine “migr” de migrare Composition du corpus : Figure/parti politique Type du représentant Nom d'utilisateur Tweets-migr 1 Adrien Quatennens PERSONNE (M) @AQuatennens 315 2 Alexis Corbière PERSONNE (M) @Alexiscorbiere 209 3 Anne Hidalgo PERSONNE (F) @Anne_Hidalgo 801 4 Arnaud Montebourg* PERSONNE (M) @montebourg 7 5 Benoît Hamon PERSONNE (M) @benoithamon 172 6 Christiane Taubira PERSONNE (F) @ChTaubira 11 7 Clémentine Autain PERSONNE (F) @Clem_Autain 102 8 Danièle Obono PERSONNE (F) @Deputee_Obono 415 9 Esther Benbassa** PERSONNE (F) @EstherBenbassa 936 10 François Hollande PERSONNE (M) @fhollande 28 11 François_Ruffin PERSONNE (M) @Francois_Ruffin 19 12 Jean-Luc Mélenchon PERSONNE (M) @JLMelenchon 240 13 Manon Aubry PERSONNE (F) @ManonAubryFr 182 14 Natalie Arthaud PERSONNE (F) @n_arthaud 165 15 Philippe Poutou PERSONNE (M) @PhilippePoutou 83 16 Raphael Glucksmann PERSONNE (M) @rglucks1 142 17 Yannick Jadot PERSONNE (M) @yjadot 374 18 Europe Écologie-Les Verts ORGANISATION @EELV 484 19 Gauche Républicaine et Socialiste ORGANISATION @Gauche_RS 73 20 Génération.s ORGANISATION @GenerationsMvt 165 21 La France Insoumise ORGANISATION @FranceInsoumise 300 22 Parti Radical Gauche ORGANISATION @PartiRadicalG 37 23 Parti Socialiste ORGANISATION @partisocialiste 376 Les figures et partis politiques, classés par ordre alphabétique, sont sélectionnés selon quatre critères : (1) le nombre important de Tweets-migr, (2) l’affiliation politique, (3) l’eurodéputé.e ou (4) la/le candidat.e à l’Élection présidentielle au cours de la période entre 2011 et 2022. Ces quatre critères ne s’excluent pas mutuellement.Dans le cadre de la recherche doctorale (Jeon, S.), les corpus FR-L-MIGR-TWIT et FR-R-MIGR-TWIT sont compilés, annotés et analysés, dans une approche comparative et d'analyse de discours, en ayant pour objectifs d'étudier la construction sémantique du lexique-migr à travers la période du quinquennat entre 2017 et 2022.*Pour l’année de 2019, un seul tweet-migr a été récupéré à partir du twitto @montebourg. Or, s’agissant de la migration des abeilles, ce tweet est exclu de ses 7 tweets-migr recensés.**Le twitto @EstherBenbassa, dont la représentante est Esther Benbassa, sénatrice et ancien membre du parti Europe Écologie-Les Verts, est rajouté ultérieurement, suite à la prise en compte du fait que le nombre important de ses Tweets-migr ont été retweetés par le twitto @EELV. Le Corpus MIGR-TWIT consiste en trois sous-corpus, comptant un total de 23,869 Tweets et de 703,016 mots: Corpus FR-R-MIGR-TWIT-2011-2022 : corpus de tweets-migr de la droite politique française Corpus UK-R-MIGR-RA-TWIT-2011-2022 : corpus de tweets-migr de la droite politique britannique Corpus FR-L-MIGR-TWIT-2011-2022 : corpus de tweets-migr de la gauche politique française Financement: - Université de Lille, Projet d'Internationalisation 2021 - Université Franco-italienne / Università Italo Francese - Campus France (Partenariats Hubert Curien): Italie - PHC Galilée 2018-19 ; Bay-Bas - PHC Van Gogh 2018-19

The FR-L-MIGR-TWIT Corpus is part of the MIGR-TWIT CORPORA, diachronic bilingual corpus of Tweets about the topic of migration in Europe. Within the framework of the collaborative research project OLiNDiNUM (Observatoire LINguistique du DIscours NUMérique, [Linguistic Observatory of Online Debate]), the MIGR-TWIT Corpora are created with the aim to study the evolution of the public discourse on migration in Europe during the past dozen years from 2011 to 2022. First two components of the corpus represent migration discourse of right-wing politics in France and in the UK. The FR-L-MIGR-TWIT Corpus represents French left-wing politics' migration discourse on Twitter. Using the Twitter API v2 Academic Research, the Tweets containing at least one occurrence of lexicon derived from a latin root "migr" of migrare are automatically retrieved from 23 Twitter accounts of French left-wing political figures and parties.ContentsThe downloadable version of FR-L-MIGR-TWIT-2011-2022 Corpus contains 32 CSV files (tabular format). The corpus is presented in simplified and elaborate versions in terms of metadata. The simplified version corresponds to one single file entitled FR-L-MIGR-TWIT-2011-2022.csv, containing four basic (meta)data, i.e. identifier, text, posting date and username (that is, data__id, data__text, data__created_at and author__name as the table hearder elements). In addition to these four (meta)data, the elaborate version is provided with all Tweet fields information included as a header element, such as the numbers of Replies, Retweets, Likes and Quotes, etc. This version is also available in one single CSV file named FR-L-MIGR-TWIT-2011-2022_meta.csv. Besides, the elaborate version is provided with the files organized by year and by name of political figure/party. 7 CSV files in the folder named FR-L-MIGR-TWIT-YEAR correspond to each and every year (e.g. FR-L-MIGR-TWIT-2017_meta.csv, and so on) or grouped years (i.e. FR-L-MIGR-TWIT-2011-2016_meta.csv) for the last dozen years. 23 files in the folder named FR-L-NAME-MIGR-TWIT for each and every component of selected French left-wing political figures and parties (e.g. FR-L-Arthaud-TWIT_meta.csv). The zip file named FR-L-MIGR-TWIT-2011-2022_meta contains yearly Tweets of each and every political figures and parties.Detailed information of the FR-L-MIGR-TWIT-2011-2022 CORPUS is illustrated below.Created at: 2023-04-18Language: FRCoverage: 23 user accounts ; 5,636 Tweets ; 169,818 wordsTime of data collection: start=2011-01-01 ; end=2022-06-30Keywords: words derived from a latine root “migr” of migrareCorpus composition: Political Figure/partyType of representativeUsernamemigr-Tweets1Adrien QuatennensPERSON (M)@AQuatennens3152Alexis CorbièrePERSON(M)@Alexiscorbiere2093Anne HidalgoPERSON (F)@Anne_Hidalgo8014Arnaud Montebourg*PERSON (M)@montebourg75Benoît HamonPERSON (M)@benoithamon1726Christiane TaubiraPERSON (F)@ChTaubira117Clémentine AutainPERSON (F)@Clem_Autain1028Danièle ObonoPERSON (F)@Deputee_Obono4159Esther Benbassa**PERSON (F)@EstherBenbassa93610François HollandePERSON (M)@fhollande2811François_RuffinPERSON (M)@Francois_Ruffin1912Jean-Luc MélenchonPERSON (M)@JLMelenchon24013Manon AubryPERSON (F)@ManonAubryFr18214Natalie ArthaudPERSON (F)@n_arthaud16515Philippe PoutouPERSON (M)@PhilippePoutou8316Raphael GlucksmannPERSON (M)@rglucks114217Yannick JadotPERSON (M)@yjadot37418Europe Écologie-Les VertsORGANIZATION@EELV48419Gauche Républicaine et SocialisteORGANIZATION@Gauche_RS7320Génération.sORGANIZATION@GenerationsMvt16521La France InsoumiseORGANIZATION@FranceInsoumise30022Parti Radical GaucheORGANIZATION@PartiRadicalG3723Parti SocialisteORGANIZATION@partisocialiste376Political figures and parties, listed in alphabetical order, are selected according to the four criteria: (1) the high number of migr-tweets, (2) the political affiliation, (3) the political careers, that is, the Member of the European Parliament or (4) the presidential candidate during the period between 2011 and 2022. These four criteria are not mutually exclusive.As part of a doctoral thesis (Jeon, S.), the FR-L-MIGR-TWIT and FR-R-MIGR-TWIT corpora are compiled, annotated and analyzed through a comparative discourse analysis approach, with the aim to study the semantic construction of migr-lexicon over the 5-year-period between two recent French Presidential elections.*One migration Tweet retrieved from the user account @montebourg for the year of 2019 was removed and is not included in his 7 migr-tweets because it refers to the issue of the migration of honey bees.**We later added the user account @EstherBenbassa represented by Esther Benbassa, senator and former member of political party Europe Écologie-Les Verts (representative of the user account @EELV), because of the high number of her migr-tweets that were retweeted by @EELV. The MIGR-TWIT Corpus consists of three subcorpora for a total amount of 23,869 Tweets and 703,016 words:FR-R-MIGR-TWIT-2011-2022 Corpus: French Right-wing politics' migr-tweetsUK-R-MIGR-RA-TWIT-2011-2022 Corpus: British Right-wing politics' migr-tweetsFR-L-MIGR-TWIT-2011-2022 Corpus: French Left-wing politics' migr-tweets Funding acknowledgements:- Université de Lille, Projet d'Internationalisation 2021- Université Franco-italienne / Università Italo Francese- Campus France (Hubert Curien Partnerships): Italie - PHC Galilée 2018-19 ; Bay-Bas - PHC Van Gogh 2018-19

