UN CRITÈRE BASÉ SUR LA DISTANCE DE MAHALANOBIS POUR L'AFFECTATION D'OBJETS SUPPLÉMENTAIRES AUX CLASSES D'UNE CAH EUCLIDIENNE

Fiche du document

Date

2 juin 2014

Type de document
Périmètre
Langue
Identifiants
Organisation

Sciences Po

Licence

info:eu-repo/semantics/OpenAccess




Citer ce document

Frédérik Cassor et al., « UN CRITÈRE BASÉ SUR LA DISTANCE DE MAHALANOBIS POUR L'AFFECTATION D'OBJETS SUPPLÉMENTAIRES AUX CLASSES D'UNE CAH EUCLIDIENNE », Archive ouverte de Sciences Po (SPIRE), ID : 10670/1.aho6i8


Métriques


Partage / Export

Résumé En Fr

In a Euclidean hierarchical ascending clustering (HAC, Ward's method), the usual method for allocating a supplementary individual to a cluster is based on the geometric distance from the individual--point to the barycenter of the cluster. The main drawback of this method is that it does not take into consideration that clusters differ as regards weights, shapes and dispersions. Neither does it take into account successive dichotomies of the hierarchy of clustering. This is why we propose a new ranking rule adapted to geometric data analysis that takes the shape of clusters into account.From a set of supplementary individuals, we propose a strategy for assigning these individuals to clusters stemming from a HAC. The idea is to assign supplementary individuals at the local level of a node to one of its two successors until a cluster of the partition under study is reached.We define an allocation criterion based on the ratio of Mahalanobis distances from the individual--point to barycenters of the two clusters that make up the node. We first introduce the principle of the allocation method, and we apply it to several barometric surveys carried out by the CEVIPOF on various components of trust among French voters. We study the evolution of clusters of individuals between 2009 and 2013. To do so, we have written a program in R language.

Dans une classification ascendante hiérarchique euclidienne (méthode de Ward), la méthode usuelle d'affectation d'un individu supplémentaire à une classe est basée sur la distance géométrique du point-individu au centre de la classe. Cette méthode présente l'inconvénient de ne pas tenir compte de ce que les classes différent, quant aux poids, à leurs formes et à leurs dispersions ; elle ne tient pas compte également des dichotomies successives de la hiérarchie de parties issue de la classification. C'est pourquoi nous proposons une nouvelle règle de classement adaptée à l'analyse géométrique des données qui tient compte de la forme de chacune des classes. Partant d'un ensemble d'individus supplémentaires, nous proposons une stratégie d'affectation de ces individus aux classes issues d'une hiérarchie binaire de parties. L'idée est d'affecter les individus supplémentaires au niveau local d'un nœud à l'un de ses deux successeurs, jusqu'à parvenir à une classe de la partition étudiée. Nous définissons un critère qui repose sur le rapport des distances de Mahalanobis du point-individu au centre des deux classes constituant le nœud. Nous présentons d'abord le principe de la méthode, puis nous l'appliquons à des enquêtes barométriques initiées par le CEVIPOF qui portent sur la confiance des électeurs français. Nous étudions l'évolution des classes d'individus entre 2009 et 2013. Pour cela, nous avons écrit un programme en langage R qui s'exécute depuis le logiciel SPAD.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Exporter en