Czym jest systematyczne pobieranie próbek?

Systematyczne pobieranie próbek jest rodzajem probabilistycznej metody pobierania próbek, w której członkowie próby z większej populacji są wybierani w losowym punkcie wyjścia, ale ze stałym i okresowym odstępem czasu. Ten interwał, zwany interwałem próbkowania, jest obliczany poprzez podzielenie wielkości populacji przez pożądaną wielkość próby.

Pomimo że populacja objęta próbą została wybrana z wyprzedzeniem, systematyczne pobieranie próbek jest nadal uważane za losowe, jeżeli przedział okresowy jest określony z wyprzedzeniem, a punkt początkowy jest losowy.

Jak działa systematyczne pobieranie próbek

Ponieważ proste losowe pobieranie próbek z populacji może być nieefektywne i czasochłonne, statystycy zwracają się do innych metod, takich jak systematyczne pobieranie próbek. Wybór wielkości próby poprzez podejście systematyczne może być dokonany szybko. Po określeniu stałego punktu wyjścia, wybierany jest stały odstęp czasu, aby ułatwić wybór uczestników.

Systematyczne losowe pobieranie próbek jest zalecane w przypadku prostego losowego pobierania próbek, gdy istnieje małe ryzyko manipulacji danymi. Jeżeli ryzyko to jest wysokie, gdy badacz może manipulować długością interwału w celu uzyskania pożądanych wyników, bardziej odpowiednia byłaby prosta technika losowego pobierania próbek.

Ten rodzaj próbkowania jest popularny wśród badaczy i analityków ze względu na swoją prostotę. Badacze zazwyczaj zakładają, że wyniki są reprezentatywne dla większości normalnych populacji, chyba że przy każdej “dziewiątej” próbie danych (co jest mało prawdopodobne) istnieje nieproporcjonalnie duża liczba cech losowych. Innymi słowy, populacja musi wykazywać naturalny stopień losowości wraz z wybraną metryką. Jeżeli populacja posiada znormalizowany typ modelu, ryzyko przypadkowego wyboru bardzo częstych przypadków jest bardziej oczywiste.

W systematycznym pobieraniu próbek, podobnie jak w przypadku innych metod pobierania próbek, przed wyborem uczestników musi zostać wybrana populacja docelowa. Populacja może być zidentyfikowana na podstawie dowolnej liczby pożądanych cech, które pasują do celu bieżącego badania. Niektóre kryteria wyboru mogą obejmować wiek, płeć, rasę, rasę, lokalizację, poziom wykształcenia i/lub zawodu.

Przykłady

Jako hipotetyczny przykład systematycznego pobierania próbek należy przyjąć, że w populacji liczącej 10 000 osób jeden statystyk wybiera co setną osobę do próby. Przedziały czasowe pobierania próbek mogą być również systematyczne, np. wybór nowej próbki do pobrania co 12 godzin.

Jako inny przykład, gdybyś chciał wybrać losową grupę 1 000 osób z populacji 50 000 osób przy użyciu systematycznego pobierania próbek, wszyscy potencjalni uczestnicy musieliby zostać ujęci na liście i wybrany zostałby punkt wyjścia. Po utworzeniu listy, co 50. osoba na liście (rozpoczynająca liczenie w wybranym punkcie wyjścia) zostałaby wybrana jako uczestnik, ponieważ 50 000/1 000 = 50.

Na przykład, jeśli wybrany punkt startowy wynosiłby 20, wybrana zostałaby 70. osoba na liście, a następnie 120. i tak dalej. Po osiągnięciu końca listy i jeśli potrzebnych jest więcej uczestników, liczenie przesuwa się na początek listy, aby zakończyć liczenie.

Systematyczne pobieranie próbek w klastrach

Systematyczne pobieranie próbek i dobór próby zbiorczej różnią się sposobem wyodrębnienia punktów poboru próbek z populacji objętej próbą. Pobieranie próbek w skupiskach dzieli populację na skupiska, podczas gdy systematyczne pobieranie próbek wykorzystuje stałe odstępy czasu od większej populacji w celu utworzenia próby.

Systematyczne pobieranie próbek wybiera losowy punkt wyjścia z populacji, a następnie próbka jest pobierana z regularnych stałych przedziałów czasowych z populacji zgodnie z jej wielkością. Próbkowanie klastrowe dzieli populację na klastry, a następnie pobiera z każdego klastra prostą, losową próbkę.

Pobieranie próby w skupiskach jest uważane za mniej dokładne niż inne metody pobierania prób. Jednak uzyskanie próby może zaoszczędzić na kosztach. Pobieranie próbek w klastrach jest dwuetapową procedurą pobierania próbek. Można ją stosować, gdy trudno jest wypełnić listę całej populacji. Na przykład, może być trudno zbudować całą populację klientów sklepu spożywczego, z którymi ma być przeprowadzony wywiad.

Przykłady systematycznego pobierania próbek

Jako hipotetyczny przykład systematycznego pobierania próbek należy przyjąć, że w populacji liczącej 10 000 osób jeden statystyk wybiera co setną osobę do próby. Przedziały czasowe pobierania próbek mogą być również systematyczne, np. wybór nowej próbki do pobrania co 12 godzin.

Jako inny przykład, gdybyś chciał wybrać losową grupę 1 000 osób z populacji 50 000 osób przy użyciu systematycznego pobierania próbek, wszyscy potencjalni uczestnicy musieliby zostać ujęci na liście i wybrany zostałby punkt wyjścia. Po utworzeniu listy, co 50. osoba na liście (rozpoczynająca liczenie w wybranym punkcie wyjścia) zostałaby wybrana jako uczestnik, ponieważ 50 000/1 000 = 50.

Na przykład, jeśli wybrany punkt startowy wynosiłby 20, wybrana zostałaby 70. osoba na liście, a następnie 120. i tak dalej. Po osiągnięciu końca listy i jeśli potrzebnych jest więcej uczestników, liczenie przesuwa się na początek listy, aby zakończyć liczenie.

Systematyczne pobieranie próbek w klastrach

Systematyczne pobieranie próbek i dobór próby zbiorczej różnią się sposobem wyodrębnienia punktów poboru próbek z populacji objętej próbą. Pobieranie próbek w skupiskach dzieli populację na skupiska, podczas gdy systematyczne pobieranie próbek wykorzystuje stałe odstępy czasu od większej populacji w celu utworzenia próby.

Systematyczne pobieranie próbek wybiera losowy punkt wyjścia z populacji, a następnie próbka jest pobierana z regularnych stałych przedziałów czasowych z populacji zgodnie z jej wielkością. Próbkowanie klastrowe dzieli populację na klastry, a następnie pobiera z każdego klastra prostą, losową próbkę.

Pobieranie próby w skupiskach jest uważane za mniej dokładne niż inne metody pobierania prób. Jednak uzyskanie próby może zaoszczędzić na kosztach. Pobieranie próbek w klastrach jest dwuetapową procedurą pobierania próbek. Można ją stosować, gdy trudno jest wypełnić listę całej populacji. Na przykład, może być trudno zbudować całą populację klientów sklepu spożywczego, z którymi ma być przeprowadzony wywiad.

Jednakże jedna osoba może stworzyć losowy podzbiór sklepów, co jest pierwszym krokiem w tym procesie. Drugim krokiem jest przeprowadzenie wywiadu z losowo wybraną grupą klientów tych sklepów. Jest to prosty, ręczny proces, który może zaoszczędzić czas i pieniądze.

Ograniczenia systematycznego pobierania próbek

Jedno z zagrożeń, które powinni wziąć pod uwagę statystycy podczas przeprowadzania systematycznego pobierania próbek, dotyczy organizacji wykazu wykorzystywanego w danym okresie pobierania próbek. Jeżeli populacja objęta wykazem jest zorganizowana w sposób cykliczny, odpowiadający okresowi pobierania próbek, wybrana próbka może zostać zniekształcona.

Na przykład, dział kadr przedsiębiorstwa chce wybrać próbę pracowników i zapytać ich, co sądzą o polityce przedsiębiorstwa. Pracownicy są grupowani w zespoły po 20 osób, a każdy z nich jest kierowany przez menedżera. Jeśli lista użyta do wyboru wielkości próby jest zorganizowana z pogrupowanymi zespołami, statystyk ryzykuje wybranie tylko menedżerów (lub brak menedżerów) w zależności od przedziału próbkowania.