Harpoon or Bait? A Comparison of Various Metrics in Fishing for Sequence Patterns

Fiche du document

Date

2012

Discipline
Type de document
Périmètre
Langue
Identifiants
Relations

Ce document est lié à :
info:eu-repo/semantics/altIdentifier/doi/10.1177/0759106312454635

Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess




Citer ce document

Nicolas Robette et al., « Harpoon or Bait? A Comparison of Various Metrics in Fishing for Sequence Patterns », HAL-SHS : sociologie, ID : 10.1177/0759106312454635


Métriques


Partage / Export

Résumé En Fr

The use of sequence analysis in the social sciences has significantly increased during the last decade or two. Sequence analysis explores and describes trajectories and ''fishes for patterns'' (Abbott, 2000). Many dissimilarity metrics exist in various domains (bioinformatics, data mining, etc.); therefore a crucial and pervasive issue in papers using sequence analysis is robustness. To what extent do the various techniques lead to consistent and converging results? What kinds of patterns are more easily fished out by each of the metrics? Here we propose a systematic comparison of about ten metrics that have been used in the social science literature, based on the examination of dissimilarity matrices computed from a simulated sequence data set including various patterns that sociologists can try to identify. This should help scholars in picking the method best suited to their data design and inquiry objectives.

L'analyse de séquences s'est considérablement répandue dans les sciences sociales depuis une vingtaine d'années. Son but consiste généralement à décrire des trajectoires et à y identifier des régularités. De nombreuses mesures de dissimilarité existent, rendant cruciale la question de la robustesse de la méthode. Les différentes techniques, produisent-elles des résultats convergents ? Quelles métriques identifient quelles régularités ? Nous proposons une comparaison systématique d'une dizaine de métriques couramment utilisées dans les travaux en sciences sociales, a partir de l'analyse des matrices de dissimilarités produites par l'analyse d'un ensemble de séquences simulées et composées des principaux types de régularités que les sociologues peuvent souhaiter étudier. On souhaite faciliter le choix par les chercheurs de la méthode la mieux en adéquation avec leurs données et leurs questions de recherche.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en