Apprentissage automatique de la propagation des étiquettes dans les réseaux sociaux multirelationnels

Fiche du document

Date

2012

Type de document
Périmètre
Langue
Identifiant
Collection

Cairn.info

Organisation

Cairn

Licence

Cairn




Citer ce document

Yann Jacob et al., « Apprentissage automatique de la propagation des étiquettes dans les réseaux sociaux multirelationnels », Document numérique, ID : 10670/1.jril3u


Métriques


Partage / Export

Résumé Fr En

Nous considérons le problème consistant à apprendre à annoter des documents avec des concepts ou des mots clefs dans des réseaux d’information avec contenu, où les documents peuvent partager plusieurs types de relation. Ces concepts associés au document dépendent à la fois de son contenu et de ses voisins dans le graphe à travers les différentes relations. Nous formalisons ce problème comme de la classification multiétiquette dans un multigraphe, les nœuds étant les documents et les arcs représentant les différentes relations. Nous introduisons une nouvelle méthode d’étiquetage des nœuds qui exploite à la fois le contenu et la structure multirelationnelle du graphe. L’algorithme apprend également à pondérer les différents types de relations selon leur importance pour la tâche d’annotation. Les expériences sur les différents corpora correspondent à différentes tâches d’annotation sur des articles scientifiques, des emails et des images de Flickr et montrent que le modèle est capable de tirer parti de l’information relationnelle riche.

We consider the problem of learning to annotate documents with concepts or keywords in content information networks, where documents may share multiple relation types. The concepts associated to a document will depend both on its content and on its neighbors through the different relations. We formalize this problem as multilabel classification in a multigraph, the nodes being the documents and the edges representing the different relation types. We introduce a new method for learning node labeling which exploits the document content and the multirelational structure of the graph. The algorithm also learns to weight the different relation types according to their importance for the annotation task. We perform experiments on different corpora corresponding to different annotation tasks on scientific articles, emails and Flickr images and show how the model may take advantage of the rich relational information.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en