Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Gli statistici utilizzano misure di sintesi per descrivere la quantità di variabilità o di diffusione in un insieme di dati. Le misure di variabilità più comuni sono l’intervallo, l’intervallo interquartile (IQR), la varianza e la deviazione standard.

L’intervallo

La gamma è la distinzione tra le qualità più grandi e quelle più piccole in molte qualità.

Pensate, per esempio, ai numeri che le accompagnano: 1, 3, 4, 5, 5, 6, 7, 11. Per questa disposizione dei numeri, l’intervallo sarebbe 11 – 1 o 10.

L’intervallo interquartile (IQR)

L’interquartile go (IQR) è una proporzione della mutevolezza, alla luce della separazione di un indice informativo in quartili.

I quartili separano un indice informativo di posizione richiesto in quattro parti equivalenti. Le qualità che separano ogni parte sono note come il principale, il secondo e il terzo quartile; e sono indicate da Q1, Q2 e Q3, individualmente…

Q1 è il valore “medio” nella prima metà dell’insieme di dati ordinati per rango.

Q2 è il valore mediano nell’insieme.

Q3 è il valore “medio” nella seconda metà del set di dati ordinati per rango.

L’intervallo interquartile è equivalente a Q3 meno Q1. Per esempio, si pensi ai numeri di accompagnamento: 1, 2, 3, 4, 5, 6, 7, 8

Eight numbers: 1, 2, 3, 4, 5, 6, 7, 8

Il T2 è il centro dell’intero indice informativo – il valore medio. In questo modello, abbiamo un numero pari di punti di dati, quindi il valore medio è equivalente alla normale delle due qualità centrali. In questo modo, Q2 = (4 + 5)/2 o Q2 = 4,5. Il T1 è il centro di un incentivo nella parte principale dell’indice informativo. Il T1 è il valore medio nella prima metà dell’insieme dei dati. Poiché c’è un numero pari di punti dati nella prima metà dell’insieme di dati, il valore medio è la media dei due valori medi, cioè, Q1 = (2 + 3)/2 o Q1 = 2,5. Q3 è il centro di un incentivo nel secondo 50% della serie di dati. Ancora una volta, poiché il secondo 50% della raccolta di informazioni ha un gran numero di percezioni, il valore centrale è la normale delle due qualità centrali; cioè, Q3 = (6 + 7)/2 o Q3 = 6,5. L’intervallo interquartile è Q3 meno Q1, quindi IQR = 6,5 – 2,5 = 4.

Si noti che questa procedura ha suddiviso l’indice informativo in quattro pezzi di dimensioni equivalenti. Il segmento iniziale è composto da 1 e 2; la sezione successiva, 3 e 4; la terza sezione, 5 e 6; e la quarta sezione, 7 e 8.

La Varianza

In una popolazione, la varianza è la normale deviazione quadrata dalla media della popolazione, caratterizzata dalla ricetta di accompagnamento:

σ2 = Σ ( Xi – μ )2/N

dove σ2 è la varianza della popolazione, μ è la media della popolazione, Xi è l’iesimo componente della popolazione e N è il numero di componenti della popolazione.

Le percezioni di un esempio arbitrario di base possono essere utilizzate per valutare la differenza di una popolazione. Per questo motivo, la varianza del campione è caratterizzata da una formula in qualche modo unica, e utilizza una notazione leggermente diversa:

s2 = Σ ( xi – x )2/( n – 1 )

dove s2 è il cambiamento dell’esempio, x è la media dell’esempio, xi è l’iesimo componente dell’esempio, e n è il numero di componenti dell’esempio. Utilizzando questa formula, la differenza dell’esempio può essere vista come un indicatore imparziale della reale fluttuazione della popolazione. In questo modo, nella remota possibilità di dover valutare un’oscura differenza di popolazione, alla luce delle informazioni di un semplice esempio irregolare, questa è la ricetta da utilizzare.

La deviazione standard

La deviazione standard è la base quadrata della modifica. Lungo queste linee, la deviazione standard di una popolazione è:

σ = sqrt [ σ2 ] = sqrt [ Σ ( Xi – μ )2/N ]

dove σ è la deviazione standard della popolazione, μ è la media della popolazione, Xi è l’iesimo componente della popolazione e N è il numero di componenti della popolazione.

Gli analisti utilizzano spesso esempi irregolari di base per misurare la deviazione standard di una popolazione, alla luce delle informazioni del test. Dato un semplice esempio arbitrario, il miglior indicatore della deviazione standard di una popolazione è il migliore:

s = sqrt [ s2 ] = sqrt [ Σ ( xi – x )2/( n – 1 ) ]

dove s è la deviazione standard dell’esempio, x è la media dell’esempio, xi è l’iesimo componente dell’esempio e n è il numero di componenti dell’esempio.

Impatto del cambio di unità

Una volta ogni tanto, gli specialisti cambiano unità di misura (da minuti a ore, da piedi a metri, e così via). Ecco come vengono influenzate le misure di variabilità quando cambiamo unità.

Nella remota possibilità che si aggiunga una costante ad ogni stima, la separazione tra le qualità non cambia. Di conseguenza, tutte le misure di variabilità (range, range interquartile, deviazione standard e varianza) rimangono le stesse.

Poi di nuovo, supponiamo di aumentare ogni incentivo di una costante. Questo ha l’impatto di aumentare la gamma, l’intervallo, l’intervallo interquartile go (IQR), e la deviazione standard di quella costante. Ha un impatto molto più evidente sul cambiamento. Aumenta la differenza per il quadrato della costante.

lingue

Weekly newsletter

No spam. Just the latest releases and tips, interesting articles, and exclusive interviews in your inbox every week.