Spatial distribution of points

Statisticians carry out close examination of spatialized data, such as the distribution of household income, the location of industrial or commercial establishments, the distribution of schools in cities, etc. Answers can be found through analyses of one or more predefined geographical scales such as neighbourhoods, districts or statistical blocks. However, it is tempting to preserve the individual data and to work with the exact position of the entities that are being studied. If that is the case, statisticians have to conduct analyses based on geolocation data without carrying out any geographical aggregation. Observations are taken as points in space and the objective is to characterise these point distributions. Understanding and mastering statistical methods that process this individual and spatialized information enables us to work on data that are now increasingly accessible and sought after because they provide very precise analyses of distributions studied (Ellison et al. 2010; Barlet et al. 2013). In this framework of analysis, statisticians who have sets of points to analyse are faced with several important methodological questions: how can such data with thousands or even millions of observations be represented and characterised spatially? What statistical tools exist that can be used to study these observations relating to households, employees, firms, stores, equipment or travel, for example? How can the qualitative or quantitative characteristics of the observations being studied be taken into account? How can any attractions or repulsions between points or between different types of points be highlighted? How can we assess the significance of the results obtained, etc? The purpose of this chapter is to help statisticians to provide statistically robust results from the study of spatialized data that is not based on predefined zoning. To do this, we will review the literature on the subject of statistical methods used to characterise point distributions and we will explain the associated issues. We will use simple examples to explain the advantages and disadvantages of the most frequently adopted approaches. The code provided in R will be used to reproduce the examples covered.

Les statisticiens examinent de près des données spatialisées, telles que la répartition des revenus des ménages, la localisation des établissements industriels ou commerciaux, la répartition des écoles dans les villes, etc. Les analyses à une ou plusieurs échelles géographiques prédéfinies, telles que les quartiers, les districts ou les îlots statistiques, permettent de trouver des réponses. Cependant, il est tentant de conserver les données individuelles et de travailler avec la position exacte des entités étudiées. Dans ce cas, les statisticiens doivent effectuer des analyses basées sur des données de géolocalisation sans procéder à une quelconque agrégation géographique. Les observations sont prises comme des points dans l'espace et l'objectif est de caractériser ces distributions ponctuelles. La compréhension et la maîtrise des méthodes statistiques qui traitent ces informations individuelles et spatialisées permettent de travailler sur des données qui sont aujourd'hui de plus en plus accessibles et recherchées car elles fournissent des analyses très précises des distributions étudiées (Ellison et al. 2010 ; Barlet et al. 2013). Dans ce cadre d'analyse, les statisticiens qui ont des ensembles de points à analyser sont confrontés à plusieurs questions méthodologiques importantes : comment représenter et caractériser spatialement de telles données comportant des milliers, voire des millions d'observations ? Quels sont les outils statistiques permettant d'étudier ces observations relatives aux ménages, aux salariés, aux entreprises, aux magasins, aux équipements ou aux déplacements, par exemple ? Comment prendre en compte les caractéristiques qualitatives ou quantitatives des observations étudiées ? Comment mettre en évidence des attractions ou des répulsions entre des points ou entre différents types de points ? Comment évaluer la signification des résultats obtenus, etc. L'objectif de ce chapitre est d'aider les statisticiens à fournir des résultats statistiquement robustes à partir de l'étude de données spatialisées qui ne sont pas basées sur un zonage prédéfini. Pour ce faire, nous ferons une revue de la littérature sur le sujet des méthodes statistiques utilisées pour caractériser les distributions ponctuelles et nous expliquerons les enjeux associés. A l'aide d'exemples simples, nous expliquerons les avantages et les inconvénients des approches les plus fréquemment adoptées. Le code fourni en R sera utilisé pour reproduire les exemples traités.

Spatial distribution of points Les configurations de points En Fr

Fiche du document

Mots-clés En

Sujets proches En Fr

Citer ce document

Métriques

Partage / Export

Résumé En Fr

Par les mêmes auteurs

Sur les mêmes sujets

Exporter en