2014
Cairn
Coralie Reutenauer et al., « Plateforme d'étiquetage dynamique pour la fouille d'opinion », Document numérique, ID : 10670/1.gdckul
Les plateformes sociales (Twitter, blogs, forums), vecteurs de la diversité des points de vue de la collectivité, constituent un vivier de données convoité pour la fouille d’opinion et l’analyse de sentiments. Dans ce cadre, les méthodes appliquées en classification n’apprennent souvent que des sorties relativement frustes : celles-ci se réduisent à une polarité ou à une gradation linéaire. Est-il possible d’apprendre des motifs plus riches avec un nombre raisonnable d’exemples ? Notre démarche est appliquée au ressenti à l’égard de marques. L’enjeu est d’analyser l’image de marque à l’aide d’un ensemble de traits lexicaux, structurés par leurs relations sémantiques. Pour prédire un tel motif par apprentissage supervisé, il est avant tout nécessaire de disposer d’un jeu de données étiquetées. Pour cela, nous avons mis en place une plateforme collaborative pour l’étiquetage de messages issus du web social en traits sémantiques et sentiments. Afin d’optimiser les étiquetages, la plateforme est sous-tendue par des mécanismes dynamiques à double vocation : filtrer les messages non pertinents et restructurer la grille d’analyse spécifique à chaque marque au fur et à mesure des annotations.