Coursera Learner working on a presentation with Coursera logo and

Qu’est-ce que l’échantillonnage systématique ?

L’échantillonnage systématique est une sorte de méthode d’échantillonnage probabiliste dans laquelle les membres d’un échantillon d’une population plus large sont sélectionnés à un point de départ aléatoire mais avec un intervalle fixe et périodique. Cet intervalle, appelé intervalle d’échantillonnage, est calculé en divisant la taille de la population par la taille de l’échantillon souhaité.

Bien que la population de l’échantillon ait été sélectionnée à l’avance, l’échantillonnage systématique est toujours considéré comme aléatoire si l’intervalle périodique est déterminé à l’avance et que le point de départ est aléatoire.

Comment fonctionne l’échantillonnage systématique

Comme un simple échantillonnage aléatoire d’une population peut être inefficace et prendre beaucoup de temps, les statisticiens se tournent vers d’autres méthodes, comme l’échantillonnage systématique. Le choix d’une taille d’échantillon par une approche systématique peut être fait rapidement. Lorsqu’un point de départ fixe est identifié, un intervalle constant est choisi pour faciliter la sélection des participants.

L’échantillonnage aléatoire systématique est recommandé par rapport à l’échantillonnage aléatoire simple lorsqu’il y a un faible risque de manipulation des données. Si ce risque est élevé lorsqu’un chercheur peut manipuler la longueur de l’intervalle pour obtenir les résultats souhaités, une technique d’échantillonnage aléatoire simple serait plus appropriée.

Ce type d’échantillonnage est populaire parmi les chercheurs et les analystes en raison de sa simplicité. Les chercheurs partent généralement du principe que les résultats sont représentatifs de la plupart des populations normales, à moins que chaque “neuvième” échantillon de données ne présente une caractéristique aléatoire disproportionnée (ce qui est peu probable). En d’autres termes, une population doit présenter un degré naturel de caractère aléatoire en même temps que la mesure choisie. Si la population dispose d’un type de modèle standardisé, le risque de choisir accidentellement des cas très courants est plus évident.

Dans l’échantillonnage systématique, comme dans les autres méthodes d’échantillonnage, une population cible doit être sélectionnée avant de choisir les participants. Une population peut être identifiée sur la base d’un nombre quelconque de caractéristiques souhaitées qui correspondent à l’objectif de l’étude en cours. Certains critères de sélection peuvent inclure l’âge, le sexe, la race, le lieu, le niveau d’éducation et/ou la profession.

Exemples

Comme exemple hypothétique d’échantillonnage systématique, supposons que dans une population de 10 000 personnes, un statisticien sélectionne une personne sur 100 pour l’échantillonnage. Les intervalles d’échantillonnage peuvent également être systématiques, par exemple en choisissant un nouvel échantillon à prélever toutes les 12 heures.

Autre exemple : si vous souhaitez sélectionner un groupe aléatoire de 1 000 personnes sur une population de 50 000 personnes en utilisant un échantillonnage systématique, tous les participants potentiels doivent être inclus dans une liste et un point de départ doit être sélectionné. Une fois la liste constituée, chaque 50ème personne de la liste (en commençant le comptage au point de départ sélectionné) serait choisie comme participant, puisque 50 000/1 000 = 50.

Par exemple, si le point de départ sélectionné est 20, la 70ème personne de la liste sera choisie, suivie de la 120ème et ainsi de suite. Une fois la fin de la liste atteinte et si d’autres participants sont nécessaires, le décompte se déplace au début de la liste pour terminer le décompte.

Échantillonnage systématique contre l’échantillonnage en grappes

L’échantillonnage systématique et l’échantillonnage en grappes diffèrent dans la manière dont ils extraient les points d’échantillonnage de la population incluse dans l’échantillon. L’échantillonnage en grappes divise la population en grappes, tandis que l’échantillonnage systématique utilise des intervalles fixes de la population plus large pour créer l’échantillon.

L’échantillonnage systématique sélectionne un point de départ aléatoire dans la population, puis un échantillon est prélevé à des intervalles fixes réguliers de la population en fonction de sa taille. L’échantillonnage en grappes divise la population en grappes et prélève ensuite un échantillon aléatoire simple dans chaque grappe.

L’échantillonnage en grappes est considéré comme moins précis que les autres méthodes d’échantillonnage. Toutefois, il peut permettre d’économiser les coûts liés à l’obtention d’un échantillon. L’échantillonnage en grappes est une procédure d’échantillonnage en deux étapes. Il peut être utilisé lorsqu’il est difficile de dresser une liste de l’ensemble de la population. Par exemple, il peut être difficile de constituer la population entière des clients d’une épicerie à interroger.

Exemples d’échantillonnage systématique

Comme exemple hypothétique d’échantillonnage systématique, supposons que dans une population de 10 000 personnes, un statisticien sélectionne une personne sur 100 pour l’échantillonnage. Les intervalles d’échantillonnage peuvent également être systématiques, par exemple en choisissant un nouvel échantillon à prélever toutes les 12 heures.

Autre exemple : si vous souhaitez sélectionner un groupe aléatoire de 1 000 personnes sur une population de 50 000 personnes en utilisant un échantillonnage systématique, tous les participants potentiels doivent être inclus dans une liste et un point de départ doit être sélectionné. Une fois la liste constituée, chaque 50ème personne de la liste (en commençant le comptage au point de départ sélectionné) serait choisie comme participant, puisque 50 000/1 000 = 50.

Par exemple, si le point de départ sélectionné est 20, la 70ème personne de la liste sera choisie, suivie de la 120ème et ainsi de suite. Une fois la fin de la liste atteinte et si d’autres participants sont nécessaires, le décompte se déplace au début de la liste pour terminer le décompte.

Échantillonnage systématique contre l’échantillonnage en grappes

L’échantillonnage systématique et l’échantillonnage en grappes diffèrent dans la manière dont ils extraient les points d’échantillonnage de la population incluse dans l’échantillon. L’échantillonnage en grappes divise la population en grappes, tandis que l’échantillonnage systématique utilise des intervalles fixes de la population plus large pour créer l’échantillon.

L’échantillonnage systématique sélectionne un point de départ aléatoire dans la population, puis un échantillon est prélevé à des intervalles fixes réguliers de la population en fonction de sa taille. L’échantillonnage en grappes divise la population en grappes et prélève ensuite un échantillon aléatoire simple dans chaque grappe.

L’échantillonnage en grappes est considéré comme moins précis que les autres méthodes d’échantillonnage. Toutefois, il peut permettre d’économiser les coûts liés à l’obtention d’un échantillon. L’échantillonnage en grappes est une procédure d’échantillonnage en deux étapes. Il peut être utilisé lorsqu’il est difficile de dresser une liste de l’ensemble de la population. Par exemple, il peut être difficile de constituer la population entière des clients d’une épicerie à interroger.

Cependant, une personne peut créer un sous-ensemble aléatoire de magasins, ce qui constitue la première étape du processus. La deuxième étape consiste à interroger un échantillon aléatoire des clients de ces magasins. Il s’agit d’un processus manuel simple qui peut faire gagner du temps et de l’argent.

Limites de l’échantillonnage systématique

Un risque à prendre en compte par les statisticiens lorsqu’ils procèdent à un échantillonnage systématique concerne l’organisation de la liste utilisée avec l’intervalle d’échantillonnage. Si la population incluse dans la liste est organisée selon un schéma cyclique qui correspond à l’intervalle d’échantillonnage, l’échantillon sélectionné peut être faussé.

Par exemple, le service des ressources humaines d’une entreprise veut choisir un échantillon de salariés et leur demander ce qu’ils pensent des politiques de l’entreprise. Les employés sont regroupés en équipes de 20 personnes, chaque équipe étant dirigée par un responsable. Si la liste utilisée pour choisir la taille de l’échantillon est organisée avec les équipes regroupées, le statisticien risque de ne choisir que des managers (ou aucun manager) en fonction de l’intervalle d’échantillonnage.