L’analisi statistica è la scienza della raccolta dei dati e della scoperta di modelli e tendenze. In realtà è solo un altro modo di dire “statistica”. Dopo aver raccolto i dati è possibile analizzarli:

Riassumere i dati. Per esempio, fare un grafico a torta.

Trovare le misure chiave della posizione. Per esempio, la media vi dice qual è il numero medio (o “middling”) in un set di dati.

Calcolare le misure intermedie: Queste vi dicono se i vostri dati sono strettamente raggruppati o più diffusi. La deviazione standard è una delle misure di diffusione più comunemente usate; vi dice quanto sono diffusi i vostri dati nella media.

Fate previsioni future basate sul comportamento passato. Questo è particolarmente utile nel commercio al dettaglio, nella produzione, nelle banche, nello sport o in qualsiasi organizzazione in cui conoscere le tendenze future sarebbe un vantaggio.

Testare l’ipotesi di un esperimento. Raccogliere dati da un esperimento racconta una storia solo quando si analizzano i dati. Questa parte dell’analisi statistica è più formalmente chiamata “Test delle ipotesi”, dove l’ipotesi nulla (la teoria comunemente accettata) è provata o smentita.

Analisi statistica e metodo scientifico

L’analisi statistica è ampiamente utilizzata nella scienza, dalla fisica alle scienze sociali. Oltre a testare le ipotesi, la statistica può fornire un’approssimazione per un’incognita difficile o impossibile da misurare. Ad esempio, il campo della teoria dei campi quantistici, pur fornendo un successo sul lato teorico delle cose, si è dimostrato impegnativo per la sperimentazione e la misurazione empirica. Alcuni argomenti di scienze sociali, come lo studio della coscienza o della scelta, sono virtualmente impossibili da misurare; l’analisi statistica può far luce su quello che sarebbe lo scenario più o meno probabile.

Quando le statistiche mentono

Mentre le statistiche possono sembrare una solida base per trarre conclusioni e presentare “fatti”, diffidate dalle insidie dell’analisi statistica. Esse includono la manipolazione deliberata e accidentale dei risultati. Tuttavia, a volte le statistiche sono semplicemente sbagliate. Un famoso esempio di statistica “semplicemente sbagliata” è il Paradosso di Simpson, che ci mostra che anche le statistiche migliori possono essere completamente inutili. In un classico caso di Simpson, le medie di ammissione dell’Università di Berkeley (correttamente) hanno mostrato che il loro tasso medio di ammissione era più alto per le donne che per gli uomini, quando in realtà era il contrario. Per una spiegazione più dettagliata di questo rompicapo, si veda il Paradosso di Simpson.