Updated : Juin 14, 2020 in Pilotes

TÉLÉCHARGER MACRO CALMAR GRATUIT

Diagrae de Lexis, calcul des taux par âge Exercise2: Statistiques inférentielles Chapitre 5: Introduction à la théorie des sondages – Cours 4 Introduction à la théorie des sondages – Cours 4 Antoine Rebecq antoine. Probabilités et distributions continues Probabilités et distributions continues Exercice 1 Si, dans une race bovine, la durée moyenne de gestation est de jours avec déviation standard égale à 5, quelle est la proportion des vaches dont la Plus en détail. Pour que cette dernière contrainte soit au mieux respectée, il faut éviter de multiplier exagérément les critères de redressement et s imposer un nombre minimal d individus par modalité par exemple, pas moins de individus par modalité. Statistique descriptive bidimensionnelle A. On note Ui Ui la 34 Insee-Méthodes:

Nom: macro calmar
Format: Fichier D’archive
Système d’exploitation: Windows, Mac, Android, iOS
Licence: Usage Personnel Seulement
Taille: 23.33 MBytes

Applications mathématiques dans le domaine de la mesure d’audience des médias Applications mathématiques dans le domaine de la mesure d’audience des médias Formation IPR « Mathématiques et sciences sociales » Jeudi 29 septembre Plan Médiamétrie Présentation de l entreprise Outils Plus en détail. Par exeple, si l’on veut caler l’échantillon d’une enquête énages sur deux répartitions « croisées », taille du énage région et CS du chef de énage région, on obtient une équation redondante par région. Ce redressement a la particularité d ajuster l échantillon de foyers sur des critères exprimés en nombre de foyers et des critères exprimés en nombre d individus. Préalablement au redressement, les totaux des variables d intérêt peuvent être estimés par l estimateur de Horwitz-Thompson: Contrat didactique du cours de statistique multivariée. Optimisation combinatoire Un algorithme heuristique permet d identifier au moins une solution réalisable à un problème Plus en détail.

Aujourd hui, le développement des enquêtes par sondage et leur extension à des domaines d application diversifiés ont entraîné une mise à contribution de plus en plus fréquente de la population. Dans un objectif de minimisation de l effet de lassitude des individus d une part, et des coûts de réalisation des enquêtes d autre part, on est souvent conduit à travailler sur des échantillons de taille restreinte.

Dans ce contexte, les soucis de pertinence de l échantillon traduite par sa représentativité et de précision des estimations conduisent le plus souvent à utiliser des informations auxiliaires, lorsqu elles sont disponibles. Celles-ci peuvent être introduites à deux niveaux: Ces deux approches reposent toutes deux sur la disponibilité d informations auxiliaires, les utilisent différemment, mais visent un même objectif: Cette technique a pour objectif de réduire la variance des estimateurs.

Pour cela, on pourra surreprésenter les strates dans lesquelles la dispersion est la plus grande. En effet, la variance étant inversement proportionnelle à la taille de l échantillon, si on sur-représente cette strate, les estimateurs seront plus précis. On sur-représentera également des sous-populations ayant des effectifs trop faibles afin d obtenir, sur cette sous-population, des estimations aussi précises que possible en comparaison avec l ensemble de la population.

Aurélie Vanheuverzwyn est chargée d études et de méthodes à la Direction Recherche et Méthodes de Médiamétrie. Le redressement Lorsque les informations auxiliaires dont on dispose sont insuffisantes ou trop contraignantes pour être utilisées au moment de l échantillonnage, on les utilise comme critères de redressement. L objectif du redressement est de s affranchir des fluctuations d échantillonnage en corrigeant des éventuelles divergences de structure, entre l échantillon et la population, de critères corrélés avec les variables d intérêt.

L étape préalable à tout redressement sera donc la recherche de tels critères. On ajuste ensuite l échantillon sur la population au regard de ces critères, qu on appellera critères de redressement ou de calage.

Lorsqu on désire ajuster l échantillon sur une seule variable auxiliaire, si celle-ci est quantitative, on utilise l estimateur par le quotient. Si, en revanche, elle est qualitative, on utilise la poststratification. Dans la plupart des enquêtes, on dispose de plusieurs critères de calage et l on souhaite ajuster l échantillon sur l ensemble de ces critères simultanément. Si on connaît la répartition des individus de la population selon les croisements des modalités de ces différents critères, on se retrouve dans le cas de la post-stratification.

Mais généralement, on ne connaît que les distributions marginales et on utilise alors la méthode de calage sur marges. Le calage sur marges Le calage sur marges consiste donc à ajuster notre échantillon sur les marges des critères de contrôle, marges maxro l on connaît sur l ensemble de la population.

Pour cela, on affecte des poids de redressement à tous les individus de l échantillon afin de pouvoir construire des estimateurs linéaires des variables d intérêt. On impose néanmoins à ces poids d être aussi proches mcro possible des poids d échantillonnage. Préalablement au redressement, les totaux des variables d intérêt peuvent être estimés par l estimateur de Horwitz-Thompson: On a donc un estimateur linéaire où le poids final attribué à calmae individu est égal au poids d échantillonnage multiplié par le coefficient de redressement.

  TÉLÉCHARGER FRONTLINE COMMANDO GRATUITEMENT

Le coefficient de redressement doit être aussi proche que possible de, traduisant un moindre écart avec le poids initial de sondage. Pour que cette dernière contrainte soit au mieux respectée, il faut éviter de multiplier exagérément les critères de redressement et s imposer un nombre minimal d individus par modalité par exemple, pas moins de individus par modalité. Il conviendra aussi de vérifier l indépendance linéaire des critères calmzr calage. En effet, toute colinéarité non structurelle entraînerait la non-convergence de l algorithme.

Exemple Prenons l exemple de deux critères: On connaît, à partir des données de l INSEE, la répartition des individus dans les classes d activité g i.

On a donc 9 marges. Pour ce qui est de l échantillon, on connaît de même les effectifs marginaux f i. L objectif est de faire tendre les marges de l échantillon les f i. Autres inactifs f f f 3 f f 5 f. Celui-ci doit être aussi proche que possible de. Le domaine de définition étant de redressement strictement positifs.

CALMAR 2 : UNE NOUVELLE VERSION DE LA MACRO CALMAR DE REDRESSEMENT D ÉCHANTILLON PAR CALAGE

On détermine l intervalle optimal, au sens de l étendue la plus réduite, par approximations successives: Distribution « type » des coefficients de redressement Densité Linéaire Raing ratio Logit Linéaire tronquée,5,9,95,5,5, On a là des allures assez courantes des distributions des coefficients de redressement. On remarque que la méthode linéaire est la plus étendue vers la gauche, c est-à-dire qu elle donne les poids les plus faibles.

La méthode raing ratio donne quant à elle les poids les plus élevés. Les méthodes bornées ont, par définition, les étendues les plus faibles, mais les distributions des coefficients de redressement ont des allures moins proches de la courbe de Gauss de par les accumulations aux bornes.

La méthode linéaire est celle qui converge le plus rapidement après deux itérations. La méthode raing ratio donne des poids plus élevés que ceux issus de la méthode linéaire. Elle donne généralement la distribution la plus dissymétrique c est-à-dire la plus étendue vers la droite.

macro calmar

Les méthodes bornées ont l avantage d avoir une étendue restreinte. La contrepartie est l accumulation des poids sur ou au voisinage des deux bornes. En effet, contrairement à la méthode linéaire tronquée, la méthode logit n atteint pas strictement les bornes.

La détermination des bornes se fait par approximations successives: Ces quatre méthodes sont asymptotiquement équivalentes et la précision des estimateurs ne dépend pas de la méthode de pondération choisie. Les critères de choix entre les quatre méthodes sont donc finalement subjectifs: On pourra également se fier à l allure générale de la distribution des coefficients de redressement. Généralement, on préfèrera éviter d avoir des poids trop élevés ou trop faibles: Médiamat Médiamat est l outil de référence dans la mesure de l audience de la télévision en France au niveau national.

Il fournit quotidiennement l audience chaîne par chaîne. Des quotas sont de plus imposés au niveau des foyers.

macro calmar

Il s agit d un sondage par grappes: Préalablement à l estimation macdo effectués deux redressements: A l issue du F F F redressement, son poids final poids de redressement calmae Ceci est justifié par la structure en grappes du plan de sondage.

A l issue du redressement individuel, son poids final vaut: Les distributions des coefficients de redressement sont les suivantes: Distribution des coefficients de redressement du Médiamat,5 Densité,5,5,75,5 linéaire raing ratio logit linéaire tronquée,,3,5,7,9,3,5,7,9,3,5,7,9 3, 3,3 3,5 3,7 3,9, – 7.

La macro SAS CALMAR | Insee

La méthode raing ratio donne quant à elle des coefficients pouvant allant jusqu à, c est-à-dire qu un poids initial peut être multiplié par un coefficient macrro redressement allant jusqu à, ce qui paraît excessif. Les méthodes bornées permettent de réduire l intervalle à [, ;,]. Les allures générales des courbes sont similaires pour les quatre méthodes. On choisira donc plutôt une méthode bornée et, afin d éviter une accumulation excessive des coefficients aux calmaf, on optera pour la méthode logit.

C est une enquête en face à face qui a pour but de quantifier l équipement multimédia des Français ainsi que les usages et comportements induits. La population de référence est celle des individus de ans et plus. Le plan de sondage repose sur une stratification région UDA 9 régions par type d mavro 5 catégories.

Un redressement est ensuite effectué. Ce redressement a la particularité d ajuster l échantillon de foyers sur des critères exprimés en nombre de foyers et des critères exprimés en nombre d individus. Pour passer d une base de données de niveau foyers à une base de niveau individus, on attribue à chaque individu le poids du foyer auquel il appartient, ceci étant justifié par la structure en grappes.

  TÉLÉCHARGER MEZOUED GRATUIT GRATUITEMENT

Comparons les distributions des coefficients de redressement selon les quatre méthodes. Distribution des coefficients de redressement de la Multimédia linéaire raing ratio logit linéaire tronquée,5,5,5,5 On constate que les allures générales sont très différentes entre les méthodes non bornées et les méthodes bornées.

La méthode linéaire donne des coefficients de redressement négatifs allant jusqu à,7. La borne supérieure vaut. La distribution des coefficients issus de la méthode 3 Institut de Sondages Lavialle Union des Annonceurs -. La borne minimale vaut, et la borne maximale 3. Les méthodes bornées permettent de réduire de manière assez importante l intervalle dans lequel sont compris les coefficients, mais on remarque, dans le cas de l intervalle optimal au sens de l étendue minimale [,5 ;,5], une accumulation excessive aux bornes ou à leur voisinage.

Cette accumulation est le signe de contraintes de bornage un peu trop fortes.

La distribution obtenue est la suivante. Distribution des coefficients de redressement de la Multimédia logit [,5 ;,5] logit [,5 ;,] linéaire tronquée [,5 ;,5] linéaire tronquée [,5 ;,] Densité,5,7,9,3,5 Sur ce graphique sont comparées uniquement les méthodes bornées: La distribution obtenue est plus satisfaisante pour ce dernier dans la mesure où l accumulation aux bornes est moins importante et on retrouve une densité élevée aux alentours de. Pistes d amélioration Même si les méthodes bornées ont l avantage de permettre une distribution des poids de redressement dans un intervalle réduit, l allure de cette distribution peut être gênante de par les accumulations aux bornes.

Mais dans une optique de production, cette manipulation est peu concevable. Une idée pour y remédier est de concevoir une fonction de distance adaptée à la production, c est-à-dire autonome ; plus cette fonction est convexe, moins la distribution des poids de redressement est étendue. En effet, soient deux fonctions de distance G et G définies sur le domaine D, telles que: G x G xx D, alors les coefficients de redressement, solutions du problème d optimisation sous contraintes, seront plus concentrés autour de avec G qu avec G.

Une nouvelle fonction G La fonction sinus hyperbolique a retenu notre attention dans la mesure où sa croissance est plus forte que celle des fonctions G proposées sous CALMAR. Pour que G soit une fonction de distance, il faut qu elle vérifie les conditions suivantes: Applications aux données de la Multimédia L application de cette distance aux exemples du paragraphe précédent donne une distribution des coefficients de redressement similaire à celle issue de la méthode raing ratio, mais située dans un intervalle de valeurs plus restreint.

Si on reprend l exemple de la Multimédia, la méthode dérivée de la fonction sinus hyperbolique donne des coefficients de redressement compris entre,3 et, alors qu avec la méthode raing ratio ceux-ci s inscrivent dans l intervalle [, ; 3, ]. Cette nouvelle fonction de distance permet donc de réduire confortablement l intervalle des coefficients de redressement, tout en conservant une allure générale satisfaisante Applications aux données du Médiamat L application de cette distance aux données du Médiamat est également concluante: Distribution des coefficients de redressement du Médiamat raing ratio sinus hyperbolique densité,5,5,5 3, 3,5, On se rapproche ainsi de l intervalle optimal des méthodes bornées [, ;,]sans avoir l inconvénient des accumulations aux bornes.

En effet, en accentuant la convexité de la fonction de distance, on réduit, de manière mécanique, -. Le bornage de la fonction de distance apparaît comme un avantage de la méthode puisqu il permet, par le choix des bornes, de maîtriser l étendue de la distribution des coefficients de redressement, tout en gérant au mieux la question de l accumulation au voisinage des bornes.

On peut cependant souhaiter s affranchir de cette dernière question en renonçant au bornage mais en prenant une fonction de distance pénalisant rapidement et fortement les valeurs qui s éloignent de.

C est le sens de la dernière fonction proposée, dont on a vu l apport par rapport à la fonction raing ratio.

macro calmar