Propriétés asymptotiques de la distribution de l'échantillon dans le cas d'un plan de sondage informatif. (Asymptotic properties of the sample distribution under informative selection) Bonnéry, Daniel - (2011-11-24) / Université de Rennes 1, Université européenne de Bretagne - Propriétés asymptotiques de la distribution de l'échantillon dans le cas d'un plan de sondage informatif.
| |||
Langue : Directeur(s) de thèse: Coquet, François; Breidt, Jay Discipline : Doctorat de l'université de Rennes1 mention mathématiques fondamentales et applications Ecole Doctorale : Mathématiques, informatique, signal et électronique et télécommunications. Classification : Mathématiques Mots-clés : plan de sondage informatif, échantillonnage, théorie de l'estimation, algorithme du cube, pseudo-vraisemblance, Glivenko-Cantelli, Estimateurs à noyaux de la densité, modèle fixe de population, modèle de superpopulation
| |||
Résumé : Étant donné un modèle de super-population (des variables aléatoires sont générées indépendamment et selon une même loi initiale sur une population) et un plan de sondage informatif, une loi de probabilité limite et une densité de probabilité limite des observations sur l’échantillon sont définies correspondant à des tailles de population et d'échantillon tendant vers l'infini. Le processus aléatoire de sélection peut induire une dépendance entre les observations sélectionnés. Un cadre asymptotique et des conditions faibles sur le processus de sélection sont donnés, sous lesquels les propriétés asymptotiques classiques sont conservées malgré la dépendance des données : la convergence uniforme de la fonction de répartition empirique. Par ailleurs, nous donnons la vitesse de convergence de l’estimateur à noyau de la densité vers la densité limite de l’échantillon. Ces résultats constituent des indications selon lesquelles il est parfois possible de considérer que les réalisations sur l’échantillon sont id et suivent approximativement la densité limite définie, notamment dans une perspective d’inférence sur le modèle de super-population. Par exemple, étant donné un modèle paramétrique on peut définir la vraisemblance approchée de l’échantillon comme produit de densités limites et un estimateur de maximum de vraisemblance approchée, dont on établit la normalité asymptotique . La dernière partie traite de tirage équilibré : des algorithmes de calcul de probabilités d’inclusion minimisant une approximation de la variance de l’estimateur de Horvitz-Thompson d'un total sont proposés. Abstract : Consider informative selection of a sample from a finite population. Responses are realized as iid random variables with a probability density function (pdf) f, referred to as the superpopulation model. A limit sample pdf, when population and sample sizes grow to infinity, is defined. The selection is informative in the sense that the sample responses, given that they were selected, are not iid f . The informative selection mechanism may induce dependence among the selected observations. An asymptotic framework and weak conditions on the informative selection mechanism are developed under which the empirical cdf converges uniformly and we compute the rate of convergence of the kernel density estimator to the limit sample pdf. When weak conditions on the selection are satisfied, one can consider that the responses are iid in order to make inference on a parametric population distribution. For example, we can define an approximated likelihood derived as the product of limit sample pdf’s and compute a maximum sample likelihood estimator of the population parameter. Convergence and asymptotic normality of this estimator is established. The last part of the dissertation deals with balanced sampling. Consider a sampling design balanced on a set of design variables z, which may depend on the inclusion probabilities. The variance of the Horvitz Thompson estimator of the total of a study variable y can be approximated by a function of y, z, and the inclusion probabilities. We propose algorithms that compute the inclusion probabilities that minimize this approximate variance. |