Apprentissage en temps réel pour la collecte d’information dans les réseaux sociaux

Fiche du document

Date

2015

Type de document
Périmètre
Langue
Identifiant
Collection

Cairn.info

Organisation

Cairn

Licence

Cairn




Citer ce document

Thibault Gisselbrecht et al., « Apprentissage en temps réel pour la collecte d’information dans les réseaux sociaux », Document numérique, ID : 10670/1.h7ai1b


Métriques


Partage / Export

Résumé Fr En

Dans cet article nous nous intéressons à la collecte d’information dans les réseaux sociaux. Cette tâche, primordiale pour de nombreuses applications, se heurte souvent à diverses contraintes liées aux ressources à disposition ou à des restrictions imposées par les API des médias considérés. Nous formulons cette tâche comme un problème de sélection dynamique de sources, pour lequel nous proposons une méthode d’apprentissage pour orienter la collecte vers les données les plus pertinentes en fonction d’un besoin spécifié. Notre méthode est basée sur une extension d’un algorithme de bandit combinatoire récemment proposé. Nous fournissons des garanties théoriques sur le comportement de l’algorithme, que nous évaluons ensuite sur différents jeux de données Twitter, à la fois hors ligne et en ligne, pour différents besoins de données exprimés.

We consider the problem of capturing information on social media under bounded resource. The latter may correspond to real time constraints such as response time limitation, limited computing resources, or social media API restrictions. We formulate this problem as a dynamic source selection problem. We then propose a machine learning methodology for dynamically selecting the most relevant information sources for a given information need. This method is based on an extension of a recently proposed combinatorial bandit algorithm. We provide theoretical guarantees on the behavior of the algorithm. We then evaluate the algorithm on different Twitter datasets for both offline and online settings.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en