23 mars 2023
info:eu-repo/semantics/openAccess
Paul Cochet et al., « Surreprésenter les populations rares grâce au tirage simultané de plusieurs enquêtes », Archined : l'archive ouverte de l'INED, ID : 10670/1.7g0dxz
Les enquêtes Étude des relations familiales et intergénérationnelles (Erfi) et Famille et Employeurs (FamEmp) vont chacune faire l’objet d’un tirage dans Nautile-Fidéli avec une surreprésentation de certaines sous-populations (dont les personnes en couple de même sexe). Afin d’éviter la distorsion qui surviendrait dans la base de sondage suite à ces diverses surreprésentations, l’Insee recourt à une technique de marquage consistant à doubler l’échantillon tiré d’un échantillon complémentaire de manière à ce que la réunion des deux échantillons, ainsi que la base de sondage résiduelle, aient la même structure que la base de sondage initiale. Nous proposons ici une façon de mettre à profit ce marquage afin de surreprésenter certaines populations rares. Il s’agit, par exemple, pour l’enquête Erfi d’ajouter aux couples de même sexe de l’échantillon Erfi ceux que nous pourrons capter dans l’échantillon complémentaire de l’enquête FamEmp. Sur la base de plusieurs simulations, nous montrons que cette méthode présente plusieurs vertus, permettant notamment de doubler le nombre de couples de même sexe présumés que nous pouvons attendre dans notre échantillon tout en réduisant la variance d’échantillonnage de plus d’un tiers.