Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

La probabilità inizia con un animale, e decidere quali impronte farà.

La statistica è vedere un’impronta, e indovinare l’animale.

La probabilità è semplice: hai l’orso. Misurate la dimensione delle zampe, la lunghezza delle zampe, e dedurrete le impronte. “Oh, il signor Bubbles pesa 400 libbre e ha gambe di un metro e mezzo, e può fare delle impronte come questa”. Più accademicamente: “Abbiamo una buona moneta. Dopo 10 lanci, ecco i possibili risultati”.

La statistica è più difficile. Misuriamo le impronte e dobbiamo indovinare quale animale potrebbe essere. Un orso? Un umano? Se otteniamo 6 teste e 4 code, quali sono le probabilità di una buona moneta?

I soliti sospetti

Ecco come “troviamo l’animale” con le statistiche:

Prendi le tracce. Ogni bit di conoscenza può essere un punto in “collegare i punti”. Più dati ci sono, più chiara è la forma (1 punto in “connetti i punti” non è utile. Un dato rende difficile la ricerca di una tendenza).

Misurare le caratteristiche essenziali. Ogni impronta presenta una profondità, larghezza e altezza. Ogni serie di dati presenta una media, una mediana, una varianza e così via. Queste descrizioni universali e generiche forniscono un restringimento approssimativo: “L’impronta è larga 6 pollici: un piccolo orso, o un uomo fuori misura?”

Trovare la specie. Ci sono decine di possibili animali (distribuzioni di probabilità) a cui pensare. Lo restringiamo con la conoscenza del sistema. all’interno del bosco? Pensate ai cavalli, non alle zebre. gestire le domande sì/no? Consideriamo una distribuzione Bernoulli .

Cercare l’animale preciso. Una volta che abbiamo la distribuzione (“orsi”), diamo un’occhiata alle nostre misure generiche durante una tabella. “Un’impronta di zampa larga 6 pollici e profonda 2 pollici è presumibilmente un orso di 3 anni, di 400 libbre”. La tabella di ricerca viene generata dalla distribuzione delle probabilità, cioè facendo misurazioni quando l’animale si trova all’interno dello zoo.

Fare ulteriori previsioni. Una volta che tutti conosciamo l’animale, prevediamo il comportamento futuro e altre caratteristiche (“Secondo i nostri calcoli, il signor Bubbles farà la cacca nel bosco”). Le statistiche ci aiutano ad ottenere informazioni sull’origine delle informazioni, dalle informazioni stesse.

Ok! La metafora non è perfetta, ma più appetibile di “La statistica è lo studio della raccolta, dell’organizzazione, dell’analisi e dell’interpretazione dei dati”. Avete bisogno di prove? Esaminiamo se ci faremo delle domande intuitive “L’ho assaggiato!

Quali sono le specie più comuni? (Distribuzioni comuni)

Ne stanno scoprendo di nuove?

Possiamo prevedere l’impronta successiva? (Estrapolazione)

Le tracce seguono un percorso? (Regressione / linea di tendenza)

Ecco due tracce, quale animale era più veloce? Più grande? (Dati di due sperimentazioni farmacologiche: quale è stato più efficace?)

L’occupazione di un animale è una direzione equivalente a quella di un altro? (Correlazione)

Due animali sono una fonte standard? (Causa: due orsi che inseguono un coniglio equivalente)