La correlazione può essere una tecnica statistica che mostrerà se e in che modo le coppie di variabili sono fortemente correlate. Per esempio, l’altezza e il peso sono correlati; le persone più alte tendono ad essere più pesanti di quelle più basse. La connessione non è perfetta. Le persone di altezza equivalente variano di peso, e si possono facilmente considerare due persone che si riconoscono dove quella più bassa è più pesante di quella più alta. Tuttavia, il peso tipico di un individuo di 5’5”’ è inferiore al peso tipico di un individuo di 5’6”’, e il loro peso medio è inferiore a quello di un individuo di 5’7”’, ecc. La correlazione può dirvi solo quale proporzione della variazione del peso delle persone è detta alla loro altezza.

Anche se questa correlazione è abbastanza ovvia, i vostri dati possono contenere correlazioni insospettabili. sospetterete anche che ci siano delle correlazioni, ma non sapete quali siano le più forti. Un’analisi intelligente delle correlazioni può causare una maggiore comprensione dei vostri dati.

Tecniche di determinazione delle correlazioni

Ci sono diverse tecniche di correlazione. Il modulo opzionale di statistica del Survey System include il tipo più comune, chiamato Pearson o correlazione prodotto-momento. Il modulo include anche una variante di questo tipo chiamata correlazione . Quest’ultima è utile una volta che si vuole sembrare alla connessione tra due variabili, eliminando l’effetto di 1 o due altre variabili.

Come tutte le tecniche statistiche, la correlazione è solo un tipo di dati sicuramente appropriato. La correlazione funziona per i dati quantificabili durante i quali i numeri sono significativi, di solito quantità di qualche tipo. Non può essere usata per dati puramente categorici, come il genere, le marche acquistate o il colore preferito.

Scala di valutazione

Le scale di valutazione sono un caso intermedio controverso. I numeri nelle scale di valutazione hanno un significato, ma questo significato non è preciso. Non sono come le quantità. Con una quantità (come il dollaro), la differenza tra 1 e un paio di dollari è strettamente equivalente a quella tra 2 e tre. Con una scala di valutazione, questo potrebbe non essere il caso. Farete in modo che i vostri intervistati pensino che una valutazione di due sia tra 1 e tre, ma non potete fare in modo che pensino che sia esattamente a metà strada. Questo è spesso molto vero se avete etichettato i punti medi della vostra scala (non potete dare per scontato che “buono” sia strettamente a metà strada tra “eccellente” e “giusto”).

La maggior parte degli statistici dice che non si possono usare correlazioni con le scale di valutazione, perché la matematica della tecnica presuppone che le differenze tra i numeri siano esattamente uguali. Ciononostante, molti ricercatori di sondaggi usano correlazioni con scale di valutazione, perché i risultati di solito riflettono il mondo importante. La nostra posizione è che si possono usare semplicemente le correlazioni con le scale di valutazione, ma è necessario farlo con cautela. Quando si lavora con le quantità, le correlazioni forniscono misurazioni precise. Quando si lavora con le scale di valutazione, le correlazioni forniscono indicazioni generali.

Coefficiente di correlazione

I principali risultati di una correlazione sono denominati il coefficiente di correlazione (o “r”). Esso va da -1,0 a +1,0. Più r è vicino a +1 o -1, più le 2 variabili sono correlate.

Se r è sull’orlo dello 0, significa che non c’è alcuna relazione tra le variabili. Se r è positivo, significa che insieme la variabile diventa più grande e l’opposto diventa più grande. Se r è negativa significa che insieme diventa più grande, l’opposto diventa più piccolo (spesso chiamata correlazione “inversa”).

Mentre i coefficienti di correlazione sono normalmente riportati come r = (un valore compreso tra -1 e +1), la loro quadratura rende più facile conoscerli. Il quadrato del coefficiente (o quadrato r) è adeguato alla percentuale di variazione di una variabile associata alla variazione all’interno dell’altra. Dopo la quadratura r, ignorare il punto percentuale . Un r di .5 significa che si dice il 25% della variazione (.5 al quadrato =.25). Un valore r di .7 significa il 49% della variazione si dice (.7 al quadrato = .49).

Un rapporto di correlazione può anche mostrare un secondo risultato di ogni test – significatività statistica. in questo caso, il livello di importanza vi dirà come è probabile che le correlazioni riportate possano essere anche grazie al caso all’interno del tipo di errore di campionamento. Se lavorate con campioni di piccole dimensioni, scegliete un formato di rapporto che abbia il livello di importanza. Questo formato riporta anche la dimensione del campione.

Una cosa fondamentale da ricordare quando si lavora con le correlazioni non è assumere che una correlazione significhi che un cambiamento in una variabile provoca un cambiamento in un’altra. Le vendite di computer privati e di scarpe da ginnastica sono aumentate notevolmente nel corso degli anni e c’è un’alta correlazione tra di loro, ma non si può presumere che l’acquisto di computer induca le persone a comprare scarpe da ginnastica (o viceversa).

Il secondo avvertimento è che la tecnica di correlazione di Pearson funziona meglio con le relazioni lineari: insieme variabile diventa più grande, il contrario diventa più grande (o più piccolo) in proporzione diretta. Non funziona bene con le relazioni curvilinee (in cui la connessione non segue una linea retta). Un esempio di relazione curvilinea è l’età e la salute. Sono correlate, ma la connessione non segue una linea. Sia i bambini piccoli che le persone più anziane tendono ad usare molto di più l’assistenza sanitaria rispetto agli adolescenti o ai giovani adulti. Le correlazioni multiple (incluse anche all’interno del Modulo Statistica) sono spesso abituate a esaminare le relazioni curvilinee, ma esulano dall’ambito di questo testo.