Définition de l’échantillonnage aléatoire stratifié

13 septembre 2021 ThePressFree Aucun commentaire

Qu’est-ce que l’échantillonnage aléatoire stratifié ?

L’échantillonnage aléatoire stratifié est une méthode d’échantillonnage qui implique la division d’une population en sous-groupes plus petits appelés strates. Dans l’échantillonnage aléatoire stratifié, ou stratification, les strates sont formées en fonction d’attributs ou de caractéristiques communs aux membres, tels que le revenu ou le niveau d’instruction.

L’échantillonnage aléatoire stratifié est également appelé échantillonnage aléatoire proportionnel ou échantillonnage aléatoire par quota.

Points clés à retenir

L’échantillonnage aléatoire stratifié permet aux chercheurs d’obtenir un échantillon de population qui représente le mieux l’ensemble de la population étudiée.
L’échantillonnage aléatoire stratifié consiste à diviser l’ensemble de la population en groupes homogènes appelés strates.
L’échantillonnage aléatoire stratifié diffère de l’échantillonnage aléatoire simple, qui implique la sélection aléatoire de données à partir d’une population entière, de sorte que chaque échantillon possible est également susceptible de se produire.

Échantillonnage aléatoire stratifié

Comment fonctionne l’échantillonnage aléatoire stratifié

Lors de la réalisation d’une analyse ou d’une recherche sur un groupe d’entités présentant des caractéristiques similaires, un chercheur peut constater que la taille de la population est trop importante pour effectuer une recherche. Pour économiser du temps et de l’argent, un analyste peut adopter une approche plus réaliste en sélectionnant un petit groupe de la population. Le petit groupe est appelé taille d’échantillon, qui est un sous-ensemble de la population qui est utilisé pour représenter l’ensemble de la population. Un échantillon peut être sélectionné à partir d’une population de plusieurs manières, dont l’une est la méthode d’échantillonnage aléatoire stratifié.

Un échantillonnage aléatoire stratifié consiste à diviser l’ensemble de la population en groupes homogènes appelés strates (pluriel pour strate). Des échantillons aléatoires sont ensuite sélectionnés dans chaque strate. Prenons l’exemple d’un chercheur universitaire qui aimerait connaître le nombre d’étudiants au MBA en 2007 qui ont reçu une offre d’emploi dans les trois mois suivant l’obtention de leur diplôme.

Il découvrira bientôt qu’il y avait près de 200 000 diplômés MBA pour l’année. Il pourrait décider de simplement prendre un échantillon aléatoire simple de 50 000 diplômés et de mener une enquête. Mieux encore, il pouvait diviser la population en strates et prélever un échantillon aléatoire parmi les strates. Pour ce faire, il créerait des groupes de population en fonction du sexe, de la tranche d’âge, de la race, du pays de nationalité et de la carrière. Un échantillon aléatoire de chaque strate est prélevé en nombre proportionnel à la taille de la strate par rapport à la population. Ces sous-ensembles de strates sont ensuite regroupés pour former un échantillon aléatoire.

[Important: Stratified sampling is used to highlight differences between groups in a population, as opposed to simple random sampling, which treats all members of a population as equal, with an equal likelihood of being sampled.]

Exemple d’échantillonnage aléatoire stratifié

Supposons qu’une équipe de recherche veuille déterminer la moyenne cumulative des étudiants universitaires à travers les États-Unis. L’équipe de recherche a des difficultés à collecter des données auprès des 21 millions d’étudiants universitaires ; il décide de prélever un échantillon aléatoire de la population en utilisant 4 000 étudiants.

Supposons maintenant que l’équipe examine les différents attributs des participants de l’échantillon et se demande s’il existe des différences dans les MPC et les majeures des étudiants. Supposons qu’il trouve que 560 étudiants sont en anglais, 1 135 en sciences, 800 en informatique, 1 090 en ingénierie et 415 en mathématiques. L’équipe souhaite utiliser un échantillon aléatoire stratifié proportionnel où la strate de l’échantillon est proportionnelle à l’échantillon aléatoire dans la population.

Supposons que l’équipe effectue des recherches sur les données démographiques des étudiants aux États-Unis et trouve le pourcentage de matières dans lesquelles les étudiants se spécialisent : 12% en anglais, 28% en sciences, 24% en informatique, 21% en ingénierie et 15% majeure en mathématiques. Ainsi, cinq strates sont créées à partir du processus d’échantillonnage aléatoire stratifié.

L’équipe doit ensuite confirmer que la strate de la population est proportionnelle à la strate de l’échantillon ; cependant, ils trouvent que les proportions ne sont pas égales. L’équipe doit ensuite ré-échantillonner 4 000 étudiants de la population et sélectionner au hasard 480 étudiants en anglais, 1 120 en sciences, 960 en informatique, 840 en ingénierie et 600 en mathématiques.

Avec ceux-ci, il dispose d’un échantillon aléatoire stratifié proportionnel d’étudiants universitaires, ce qui offre une meilleure représentation des majeures universitaires des étudiants aux États-Unis. .

Échantillons aléatoires simples contre échantillons aléatoires stratifiés

Les échantillons aléatoires simples et les échantillons aléatoires stratifiés sont tous deux des outils de mesure statistique. Un échantillon aléatoire simple est utilisé pour représenter l’ensemble de la population de données. Un échantillon aléatoire stratifié divise la population en groupes plus petits, ou strates, en fonction de caractéristiques communes.

L’échantillon aléatoire simple est souvent utilisé lorsqu’il y a très peu d’informations disponibles sur la population de données, lorsque la population de données a beaucoup trop de différences pour être divisée en plusieurs sous-ensembles, ou lorsqu’il n’y a qu’une seule caractéristique distincte parmi la population de données.

Par exemple, une entreprise de confiserie peut vouloir étudier les habitudes d’achat de ses clients afin de déterminer l’avenir de sa gamme de produits. S’il y a 10 000 clients, il peut choisir 100 de ces clients comme échantillon aléatoire. Il peut ensuite appliquer ce qu’il trouve de ces 100 clients au reste de sa base. Contrairement à la stratification, elle échantillonnera 100 membres de manière purement aléatoire sans aucun égard pour leurs caractéristiques individuelles.

Stratification proportionnelle et disproportionnée

L’échantillonnage aléatoire stratifié garantit que chaque sous-groupe d’une population donnée est correctement représenté dans l’ensemble de l’échantillon de la population d’une étude de recherche. La stratification peut être proportionnée ou disproportionnée. Dans une méthode stratifiée proportionnelle, la taille de l’échantillon de chaque strate est proportionnelle à la taille de la population de la strate.

Par exemple, si le chercheur souhaite un échantillon de 50 000 diplômés en utilisant la tranche d’âge, l’échantillon aléatoire stratifié proportionnel sera obtenu à l’aide de cette formule : (taille de l’échantillon/taille de la population) x taille de la strate. Le tableau ci-dessous suppose une population de 180 000 diplômés MBA par an.

Tranche d’âge

24-28

29-33

34-37

Le total

Nombre de personnes dans la strate

90 000

60 000

30 000

180 000

Taille de l’échantillon de strate

25 000

16 667

8 333

50 000

La taille de l’échantillon des strates pour les diplômés du MBA dans la tranche d’âge de 24 à 28 ans est calculée comme suit (50 000/180 000) x 90 000 = 25 000. La même méthode est utilisée pour les autres tranches d’âge. Maintenant que la taille de l’échantillon des strates est connue, le chercheur peut effectuer un échantillonnage aléatoire simple dans chaque strate pour sélectionner ses participants à l’enquête. En d’autres termes, 25 000 diplômés de la tranche d’âge des 24 à 28 ans seront sélectionnés au hasard dans l’ensemble de la population, 16 667 diplômés de la tranche d’âge des 29 à 33 ans seront sélectionnés de manière aléatoire dans la population, et ainsi de suite.

Dans un échantillon stratifié disproportionné, la taille de chaque strate n’est pas proportionnelle à sa taille dans la population. Le chercheur peut décider d’échantillonner 1/2 des diplômés de la tranche d’âge 34-37 ans et 1/3 des diplômés de la tranche d’âge 29-33 ans.

Il est important de noter qu’une personne ne peut pas s’intégrer dans plusieurs strates. Chaque entité ne doit correspondre qu’à une seule strate. Le fait d’avoir des sous-groupes qui se chevauchent signifie que certaines personnes auront plus de chances d’être sélectionnées pour l’enquête, ce qui nie complètement le concept d’échantillonnage stratifié en tant que type d’échantillonnage probabiliste.

Les gestionnaires de portefeuille peuvent utiliser un échantillonnage aléatoire stratifié pour créer des portefeuilles en répliquant un indice tel qu’un indice obligataire.

Avantages de l’échantillonnage aléatoire stratifié

Le principal avantage de l’échantillonnage aléatoire stratifié est qu’il capture les principales caractéristiques de la population dans l’échantillon. Semblable à une moyenne pondérée, cette méthode d’échantillonnage produit des caractéristiques dans l’échantillon qui sont proportionnelles à l’ensemble de la population. L’échantillonnage aléatoire stratifié fonctionne bien pour les populations avec une variété d’attributs, mais est sinon inefficace si des sous-groupes ne peuvent pas être formés.

La stratification donne une erreur d’estimation plus faible et une plus grande précision que la méthode d’échantillonnage aléatoire simple. Plus les différences entre les strates sont importantes, plus le gain en précision est important.

Inconvénients de l’échantillonnage aléatoire stratifié

Malheureusement, cette méthode de recherche ne peut pas être utilisée dans toutes les études. L’inconvénient de la méthode est que plusieurs conditions doivent être réunies pour qu’elle soit correctement utilisée. Les chercheurs doivent identifier chaque membre d’une population étudiée et classer chacun d’eux en une et une seule sous-population. En conséquence, l’échantillonnage aléatoire stratifié est désavantageux lorsque les chercheurs ne peuvent pas classer en toute confiance chaque membre de la population dans un sous-groupe. En outre, trouver une liste exhaustive et définitive d’une population entière peut être difficile.

Le chevauchement peut être un problème s’il y a des sujets qui appartiennent à plusieurs sous-groupes. Lorsqu’un échantillonnage aléatoire simple est effectué, ceux qui appartiennent à plusieurs sous-groupes sont plus susceptibles d’être choisis. Le résultat pourrait être une fausse représentation ou un reflet inexact de la population.

Les exemples ci-dessus facilitent les choses : les étudiants de premier cycle, les diplômés, les hommes et les femmes sont des groupes clairement définis. Dans d’autres situations, cependant, cela peut être beaucoup plus difficile. Imaginez incorporer des caractéristiques telles que la race, l’origine ethnique ou la religion. Le processus de tri devient plus difficile, faisant de l’échantillonnage aléatoire stratifié une méthode inefficace et loin d’être idéale.