8 juin 2016
Brieuc Conan-Guez et al., « Identifier les temporalités pertinentes de partages de tweets : méthode de traitement de données de masse via l'étude des hashtags », HAL-SHS : sciences de l'information, de la communication et des bibliothèques, ID : 10670/1.2m11s8
Dans le cadre d’un projet financé par l’ANR nous avons récolté plusieurs millions de tweets en lien avec des url d’articles publiés sur des sites de médias d’information. Cette communication présente les outils informatiques et statistiques mis en œuvre pour établir des typologies de circulation en fonction du critère de dispersion temporelle, afin de restituer la diversité des séquences temporelles. Afin de dégager les grandes familles de comportements de partage d’articles, nous utilisons un algorithme de classification non supervisée permettant de faire face à un défi majeur : l’existence de processus de circulation de l’information sur des échelles de temps variables.