Les dessous de la conception du plan d’échantillonnage de l’enquête ménages-déplacements du projet Modural à Bogotá (2022)

Fiche du document

Date

5 mars 2025

Périmètre
Langue
Identifiants
Relations

Ce document est lié à :
info:eu-repo/semantics/altIdentifier/doi/10.34847/nkl.4e7739u9

Collection

Archives ouvertes

Licences

http://creativecommons.org/licenses/by/ , info:eu-repo/semantics/OpenAccess




Citer ce document

Florent Demoraes et al., « Les dessous de la conception du plan d’échantillonnage de l’enquête ménages-déplacements du projet Modural à Bogotá (2022) », HAL SHS (Sciences de l’Homme et de la Société), ID : 10.34847/nkl.4e7739u9


Métriques


Partage / Export

Résumé En Es Fr

In opinion polls of large Latin American metropolises, daily mobility is the second most important concern after insecurity. A large majority of city dwellers experience real difficulties in getting around on a daily basis, and the situation is even more critical for the low-income classes relegated to outskirts. Against this backdrop, the ANR Modural project focused more specifically on commuting to and from work and school, which account for over 60% of daily journeys. The research work was carried out in eight areas illustrating the peripheral urban contexts of Bogotá (Colombia) and Lima (Peru), two capital cities that had each more than 9 million inhabitants in 2021. Two questionnaire surveys were carried out among a sample of 1,600 households (800 per city) between June and July 2022. This handbook discusses the objectives, stumbling blocks and methodological choices made to devising the sample design for the survey applied in Bogotá. In particular, it explains the advantages of adopting a stratified two-stage areal sampling design for a household survey. The different steps of the process are successively presented: (1) stratification of the survey areas based on factorial and cluster analysis, (2) associated statistical validation tests, (3) calculation of sample sizes, (4) random selection of primary units (blocks) and secondary units (households), and finally (5) calculation of weights and confidence intervals. The sampling method is based on data sources that are not specific to Bogotá. On the contrary, it relies in particular on censuses data and GIS layers (city blocks, administrative divisions, base maps and satellite images), which are now openly available in many countries in the region. In a perspective of reproducibility and open science, only free or open-source software is used, including the R software and more occasionally the QGIS and SavGIS software. The R scripts and the GIS functions used are detailed in the appendix of the handbook in order to facilitate their re-use. The same sampling method was used for the ANR Modural household survey in Lima.

En los sondeos de opinión de las grandes metrópolis latinoamericanas, la movilidad cotidiana es la segunda preocupación después de la inseguridad. Una gran mayoría de los habitantes de las ciudades experimentan verdaderas dificultades para desplazarse a diario, y esta situación es aún más crítica para las clases desfavorecidas relegadas en los barrios periféricos. En este contexto, el proyecto ANR Modural se enfocó específicamente en los desplazamientos domicilio-trabajo y domicilio-estudio, que representan más del 60% de los viajes cotidianos. La investigación se llevó a cabo en ocho áreas ilustrativas de contextos urbanos periféricos de Bogotá (Colombia) y Lima (Perú), dos capitales que contaban cada una con más de 9 millones de habitantes en 2021. Se realizaron dos encuestas por cuestionario a una muestra de 1600 hogares (800 por ciudad) entre junio y julio de 2022. Este manual aborda los objetivos, las limitaciones y las elecciones metodológicas adoptadas para el diseño muestral de la encuesta aplicada en Bogotá. En particular, explica la importancia de adoptar un muestreo bietápico estratificado de áreas para una encuesta de hogares. Se presentan sucesivamente las diferentes etapas de la elaboración del plan: (1) la estratificación de las zonas de encuesta, obtenida a partir de un análisis factorial y de conglomerados, (2) las pruebas estadísticas de validación asociadas, (3) el cálculo de los tamaños de muestra, (4) la selección aleatoria de las unidades primarias (manzanas) y de las unidades secundarias (hogares), y finalmente (5) el cálculo de los factores de expansión e intervalos de confianza. El diseño del muestreo se basa en fuentes de datos que no son específicas de Bogotá. Muy al contrario, se sustenta en datos censales y capas SIG (manzanas urbanas, divisiones administrativas, mapas base e imágenes satelitales) que hoy están en acceso libre en muchos países de la región. Con el objetivo de reproducibilidad y de ciencia abierta, se utilizaron únicamente softwares libres o gratuitos, como el software R y, ocasionalmente, QGIS y SavGIS. Los scripts R y las funciones SIG empleadas se detallan en los anexos para facilitar su reutilización. El mismo método de muestreo se implementó paralelamente para la encuesta de hogares del ANR Modural en Lima.

Dans les enquêtes d’opinion des grandes métropoles d’Amérique latine, la mobilité quotidienne représente la deuxième source de préoccupation après l’insécurité. Une grande majorité des citadins connaît de réelles difficultés pour se déplacer au quotidien, et la situation est encore plus critique pour les classes modestes reléguées dans les quartiers excentrés. Dans ce contexte, le projet ANR Modural a porté plus spécifiquement sur les navettes domicile-travail et domicile-étude qui représentent plus de 60% des trajets quotidiens. Le travail de recherche a été mené dans huit zones illustratives des contextes urbains périphériques de Bogotá (Colombie) et de Lima (Pérou), deux capitales qui comptaient chacune plus de 9 millions d’habitants en 2021. Deux enquêtes par questionnaire y ont été déployées auprès d’un échantillon de 1600 ménages (800 par ville) entre juin et juillet 2022. Le présent manuel aborde les objectifs, les contraintes et les choix méthodologiques retenus pour la conception du plan d’échantillonnage de l’enquête appliquée à Bogotá. Il explique en particulier l’intérêt d’adopter un plan d’échantillonnage aréolaire stratifié à deux degrés pour une enquête ménage. Les différentes étapes de l’élaboration du plan sont successivement présentées : (1) la stratification des zones d’enquête, obtenue à partir d’une analyse typologique, (2) les tests statistiques de validation associés, (3) le calcul des tailles d’échantillon, (4) le tirage aléatoire des unités primaires (îlots) et des unités secondaires (ménages), et enfin (5) le calcul des pondérations et des intervalles de confiance. L’élaboration de la méthode d’échantillonnage repose sur des sources de données qui ne sont pas spécifiques à Bogotá. Bien au contraire, elle s’appuie notamment sur l’utilisation des recensements et de couches SIG (îlots urbains, découpages administratifs, fonds de carte et images satellitales) qui sont aujourd’hui en libre accès dans de nombreux pays de la région. Dans une optique de reproductibilité et de science ouverte, seuls des logiciels libres ou gratuits ont été utilisés dont le logiciel R et, plus ponctuellement, les logiciels QGIS et SavGIS. Les scripts R et les fonctions SIG employées sont détaillés en annexes afin de faciliter leur réutilisation. La même méthode d’échantillonnage a été mise en œuvre parallèlement pour l'enquête ménage de l'ANR Modural à Lima.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets