Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Cos’è il campionamento sistematico?

Il campionamento sistematico è una sorta di metodo di campionamento probabilistico in cui i membri del campione di una popolazione più ampia vengono selezionati in un punto di partenza casuale ma con un intervallo fisso e periodico. Tale intervallo, chiamato intervallo di campionamento, viene calcolato dividendo la dimensione della popolazione per la dimensione del campione desiderato.

Nonostante la popolazione campione sia stata selezionata in anticipo, il campionamento sistematico è comunque considerato casuale se l’intervallo periodico è determinato in anticipo e il punto di partenza è casuale.

Come funziona il campionamento sistematico

Poiché un semplice campionamento casuale di una popolazione può essere inefficiente e richiedere molto tempo, gli statistici si rivolgono ad altri metodi, come il campionamento sistematico. La scelta della dimensione del campione attraverso un approccio sistematico può essere fatta rapidamente. Quando viene identificato un punto di partenza fisso, viene selezionato un intervallo costante per facilitare la selezione dei partecipanti.

Il campionamento sistematico casuale è raccomandato rispetto al semplice campionamento casuale quando c’è un basso rischio di manipolazione dei dati. Se questo rischio è alto quando un ricercatore può manipolare la lunghezza dell’intervallo per ottenere i risultati desiderati, una semplice tecnica di campionamento casuale sarebbe più appropriata.

Questo tipo di campionamento è popolare tra i ricercatori e gli analisti per la sua semplicità. I ricercatori generalmente presumono che i risultati siano rappresentativi della maggior parte delle popolazioni normali, a meno che non vi sia una caratteristica casuale sproporzionata con ogni “nono” campione di dati (il che è improbabile). In altre parole, una popolazione deve mostrare un grado naturale di casualità insieme alla metrica scelta. Se la popolazione ha un tipo di modello standardizzato, il rischio di scegliere accidentalmente casi molto comuni è più evidente.

Nel campionamento sistematico, come per altri metodi di campionamento, prima di selezionare i partecipanti è necessario selezionare una popolazione target. Una popolazione può essere identificata sulla base di un numero qualsiasi di caratteristiche desiderate che si adattano allo scopo dello studio in corso. Alcuni criteri di selezione possono includere l’età, il sesso, la razza, la razza, la località, il livello di istruzione e/o l’occupazione.

Esempi

Come esempio ipotetico di campionamento sistematico, si supponga che in una popolazione di 10.000 persone, uno statistico selezioni ogni 100° persona per il campionamento. Anche gli intervalli di campionamento possono essere sistematici, come la scelta di un nuovo campione da prelevare ogni 12 ore.

Come altro esempio, se si volesse selezionare un gruppo casuale di 1.000 persone su una popolazione di 50.000 persone utilizzando il campionamento sistematico, tutti i potenziali partecipanti dovrebbero essere inclusi in un elenco e verrebbe selezionato un punto di partenza. Una volta formata la lista, ogni 50esima persona della lista (iniziando il conteggio al punto di partenza selezionato) verrebbe scelta come partecipante, poiché 50.000/1.000 = 50.

Ad esempio, se il punto di partenza selezionato fosse 20, verrebbe scelta la settantesima persona della lista, seguita dalla centoventiesima e così via. Una volta raggiunta la fine della lista e se sono necessari più partecipanti, il conteggio si sposta all’inizio della lista per terminare il conteggio.

Campionamento sistematico contro il campionamento a grappolo

Il campionamento sistematico e il campionamento a grappolo si differenziano per il modo in cui estraggono i punti di campionamento dalla popolazione inclusa nel campione. Il campionamento in cluster divide la popolazione in cluster, mentre il campionamento sistematico utilizza intervalli fissi dalla popolazione più grande per creare il campione.

Il campionamento sistematico seleziona un punto di partenza casuale dalla popolazione, e poi un campione viene prelevato da intervalli fissi regolari della popolazione in base alle sue dimensioni. Il campionamento per cluster divide la popolazione in cluster e poi prende un semplice campione casuale da ogni cluster.

Il campionamento dei cluster è considerato meno preciso di altri metodi di campionamento. Tuttavia, è possibile risparmiare sui costi per ottenere un campione. Il campionamento dei cluster è una procedura di campionamento in due fasi. Può essere utilizzato quando è difficile completare un elenco dell’intera popolazione. Ad esempio, può essere difficile costruire l’intera popolazione di clienti di un negozio di alimentari da intervistare.

Esempi di campionamento sistematico

Come esempio ipotetico di campionamento sistematico, si supponga che in una popolazione di 10.000 persone, uno statistico selezioni ogni 100° persona per il campionamento. Anche gli intervalli di campionamento possono essere sistematici, come la scelta di un nuovo campione da prelevare ogni 12 ore.

Come altro esempio, se si volesse selezionare un gruppo casuale di 1.000 persone su una popolazione di 50.000 persone utilizzando il campionamento sistematico, tutti i potenziali partecipanti dovrebbero essere inclusi in un elenco e verrebbe selezionato un punto di partenza. Una volta formata la lista, ogni 50esima persona della lista (iniziando il conteggio al punto di partenza selezionato) verrebbe scelta come partecipante, poiché 50.000/1.000 = 50.

Ad esempio, se il punto di partenza selezionato fosse 20, verrebbe scelta la settantesima persona della lista, seguita dalla centoventiesima e così via. Una volta raggiunta la fine della lista e se sono necessari più partecipanti, il conteggio si sposta all’inizio della lista per terminare il conteggio.

Campionamento sistematico contro il campionamento a grappolo

Il campionamento sistematico e il campionamento a grappolo si differenziano per il modo in cui estraggono i punti di campionamento dalla popolazione inclusa nel campione. Il campionamento in cluster divide la popolazione in cluster, mentre il campionamento sistematico utilizza intervalli fissi dalla popolazione più grande per creare il campione.

Il campionamento sistematico seleziona un punto di partenza casuale dalla popolazione, e poi un campione viene prelevato da intervalli fissi regolari della popolazione in base alle sue dimensioni. Il campionamento per cluster divide la popolazione in cluster e poi prende un semplice campione casuale da ogni cluster.

Il campionamento dei cluster è considerato meno preciso di altri metodi di campionamento. Tuttavia, è possibile risparmiare sui costi per ottenere un campione. Il campionamento dei cluster è una procedura di campionamento in due fasi. Può essere utilizzato quando è difficile completare un elenco dell’intera popolazione. Ad esempio, può essere difficile costruire l’intera popolazione di clienti di un negozio di alimentari da intervistare.

Tuttavia, una persona potrebbe creare un sottoinsieme casuale di negozi, che è il primo passo del processo. Il secondo passo è quello di intervistare un campione casuale dei clienti di quei negozi. Si tratta di un semplice processo manuale che può far risparmiare tempo e denaro.

Limitazioni del campionamento sistematico

Un rischio che deve essere considerato dagli statistici quando si effettua un campionamento sistematico riguarda l’organizzazione della lista utilizzata con l’intervallo di campionamento. Se la popolazione inclusa nella lista è organizzata in un modello ciclico che corrisponde all’intervallo di campionamento, il campione selezionato può essere distorto.

Ad esempio, il dipartimento delle risorse umane di un’azienda vuole scegliere un campione di dipendenti e chiedere loro cosa ne pensano delle politiche aziendali. I dipendenti sono raggruppati in gruppi di 20, con ogni gruppo guidato da un manager. Se la lista utilizzata per scegliere la dimensione del campione è organizzata con i team raggruppati, lo statistico rischia di scegliere solo i manager (o nessun manager) a seconda dell’intervallo di campionamento.