Vers une caractérisation automatique de critères pour l'opinion-mining

Fiche du document

Date

2012

Type de document
Périmètre
Langue
Identifiant
Collection

Cairn.info

Organisation

Cairn

Licence

Cairn



Citer ce document

Benjamin Duthil et al., « Vers une caractérisation automatique de critères pour l'opinion-mining », Les Cahiers du numérique, ID : 10670/1.1eqqi5


Métriques


Partage / Export

Résumé Fr En

Les technologies de l’information et le succès des services associés (e.g. blogs, forums…) ont ouvert la voie à un mode d’expression massive d’opinions sur les sujets les plus variés (sites de e-commerces, films, etc.). Récemment, de nouvelles techniques de détection automatique d’opinion (opinion-mining) proposent des analyses statistiques des avis exprimés afin de dégager une tendance globale des opinions recueillies sur une entité évaluée. Néanmoins, une analyse plus fine montre que les arguments des internautes relèvent de critères de jugement distincts. Les approches d’opinion-mining traitent peu de cet aspect multicritère pourtant riche en informations. Dans cet article, nous proposons de caractériser automatiquement les segments de textes relevant d’un critère donné sur un corpus de critiques. À partir d’un ensemble restreint de mots-clés associés à un critère, notre approche construit automatiquement une base d’apprentissage. Des expériences menées sur des jeux de données réelles illustrent l’efficacité du processus.

The development of new services (e.g. blogs, forums…) provides facilities to express opinion on different topics. Recently new techniques known as opinion mining have emerged. They often provide statistical analyses of available opinions as an overall trend on different topics. Nevertheless, whereas it is rather easy to get such an overall trend, a more detailed analysis would highlight that cybernauts’ appraisals are related to multiple criteria. For example, a film can be classified as enthusiastic because of its great scenario, disappointing because of its poor soundtrack, etc. Our objective in this paper is to automatically extract any textual segment related to a criterion (or a subset of criteria) from a critics database. Then, for any criterion, opinion-mining techniques allow computing a partial assessment with regard to the criterion from the textual segments related to it. From a short list of key words characteristic of a criterion, our approach provides the required learning database for critics classification without further human intervention. Experiments have been carried out to illustrate and validate the efficiency of our approach.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en