Séminaire

An overview of spatially balanced methods

Cyril Favre-Martinoz (ENSAI - Bruz)

4 mai 2017, 11h00–12h15

Toulouse

Salle MS 001

MAD-Stat. Seminar

Résumé

L'information géographique (plus précisément les coordonnées géographiques (x,y)) est une information de plus en plus présente dans les bases de données à notre disposition. Celle-ci peut être mobilisée à l'étape de construction du plan de sondage afin d'en améliorer son efficacité. L'idée sous-jacente étant que si l'on a sélectionné une unité, il est souvent préférable du fait de l'autocorrélation spatiale de ne pas sélectionner l'unité voisine. Les caractéristiques de l'unité voisine étant souvent proche sur certaines caractéristiques (par exemple socio-démographiques) de l'unité sélectionnée, l'apport d'information est alors marginal. Dans cette présentation, une revue d'un certain nombre de méthodes permettant de mobiliser de l'information spatial et/ou de l'information auxiliaire afin de disperser spatialement les échantillons sera réalisée. Ensuite, une étude par simulation sera présentée afin de mettre en évidence les gains supplémentaires apportés en termes de précision par les méthodes d'échantillonnage spatial par rapport à des méthodes plus standards. Enfin, une approximation par Monte-Carlo des probabilités d'inclusion doubles pour la m éthode spatialement équilibr ée sera présentée dans le but de proposer des estimations de variance dans un contexte d'échantillonnage spatialement équilibré.------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ Geographic information - more specifically the geographic coordinates (x,y) - is increasingly present in all databases at our disposal. This information can be used at the design stage in order to improve the efficiency of the design. The underlying idea is that it is preferable to not sample a neighbouring unit of a selected unit due to the spatial autocorrelation. The socio-demographic characteristics of close units are often similar to the socio-demographic characteristics of the selected unit, therefore the additional information provided is limited. In this presentation we will give an overview of the spatially balanced method which enable us to take into account the geographic information and auxiliary information. Then a simulation study will be presented to show the additional gains on certain variables of interest due to spatial dispersion with respect to the Cube method. Finally we will present a Monte-Carlo analysis of variance estimators for this sampling method.