Cos’è la Regola Empirica?
Questa regola nelle statistiche suggerisce che ogni dato che si può osservare rientra in tre diverse deviazioni standard della media in una distribuzione normale. Potreste anche conoscere la regola empirica come la regola 68-95-99.7 o la regola dei tre sigma. Secondo la regola, il 68% dei dati cadrà nella prima deviazione standard, il 95% cadrà nella prima e nella seconda deviazione e il 99,7% dei dati cadrà in tutte e tre le deviazioni:
68% – (µ ± σ),
95% – (µ ± 2σ)
99,7% – (µ ± 3σ)
Se abbiamo una distribuzione normale dei dati su un grafico sull’asse x, la curva a campana sarà al centro. La prima deviazione standard comprende la metà positiva (µ + σ) e la metà negativa (µ – σ). Entrambe queste metà della prima deviazione standard saranno collettivamente del 68%, ma se consideriamo solo la metà positiva, sarebbe del 34%, e la metà negativa sarebbe la stessa. Allo stesso modo, se consideriamo la seconda deviazione standard, possiamo aggiungere la metà positiva della prima e della seconda deviazione con il lato negativo di entrambe le deviazioni, rendendola completa al 95%. Il fenomeno sarà lo stesso anche nella terza deviazione.
Distribuzione normale
Si tratta probabilmente di una distribuzione essenziale delle probabilità nelle statistiche. Per esempio, set di dati come la frequenza cardiaca, la pressione sanguigna, l’altezza e i punteggi del QI formeranno una curva a campana di distribuzione normale
La simmetria della distribuzione normale
La distribuzione normale è per variabili continue. Le variabili continue hanno valori infiniti. Esse includono questi valori nella distribuzione. Una distribuzione normale aiuta a descrivere il modo in cui si distribuiscono le variabili. La maggior parte delle variabili, dati o osservazioni si raggruppano al centro in una distribuzione normale, causando un picco. Questo è il motivo per cui la maggior parte delle distribuzioni normali hanno una forma a campana.
Inoltre, in una distribuzione normale, la media, la mediana e la modalità sono uguali. C’è una curva nel centro, che è la media. Tuttavia, i valori di sinistra e di destra sono uguali. È possibile definire la distribuzione normale con la media e la deviazione standard. Questi sono i due fattori essenziali che influenzano la curva. Il 68 % dell’area rientra in un’unica deviazione standard della media.
Parametri della distribuzione normale
Significato
Possiamo trovare la media del set di dati aggiungendo tutti i valori e dividendo il totale per il numero di valori.
Mediana
Quando si ordina il set di dati dal più basso al più grande, il valore medio è la mediana.
Modalità
Il modo è quel valore che appare molto spesso nel set di dati.
Deviazione standard
La deviazione standard misura quanto sono diffusi i valori dei dati. Il simbolo della deviazione standard è sigma. La deviazione standard è solo la radice quadrata delle varianze. Ad esempio, quando si misura il tasso annuale del rendimento dell’investimento, si può trovare la volatilità storica dell’investimento. Questo approccio è una misura statistica o una deviazione standard.
Varianze
Le variazioni misurano anche la diffusione dei valori. Tuttavia, questo termine si riferisce a quanto i numeri nell’insieme di dati siano distanti dalla media e da altri numeri
Z-Scores
Z-score è una rappresentazione numerica della relazione tra la media di un gruppo e il valore. È possibile calcolare lo Z-score come deviazioni standard con l’aiuto della media. Quando lo Z-score è uguale a zero, il punteggio della media e il punteggio dei dati sono uguali. Lo Z-score può essere negativo e positivo. Se uno Z-score è negativo, è inferiore alla media, e se lo Z-score è superiore alla media, è positivo.
Comprendere il concetto di 68-95-99.7 Regola
La normale distribuzione dei dati si riferisce comunemente alla regola 68-95-99.7. Si può trovare il 68% dei dati nella prima deviazione standard, il 95% dei dati nella seconda deviazione e il 99,7% dei dati nella terza deviazione della media.
Probabilità Funzione di densità
Per conoscere la percentuale, è necessario conoscere il significato della funzione di densità di probabilità o del PDF. Con l’aiuto del PDF, potete specificare la probabilità della variabile casuale che cade in un determinato intervallo di valori invece di prendere un valore diverso. Potete calcolare la probabilità eliminando l’integrale del PDF della variabile nell’intervallo. Ciò significa che l’area si trova nella funzione di densità ma tra i valori più alti e più bassi e sull’asse orizzontale della gamma.
Nella prima deviazione standard, c’è il 68% dei dati. Quindi, se si vuole trovare la probabilità di atterraggio del punto di dati casuali nella prima deviazione standard, è necessario calcolare la media dei dati da -1 a 1 deviazione standard.
Nella seconda deviazione standard, c’è il 95% dei dati. Quindi, se si vuole trovare la probabilità di un atterraggio casuale nella seconda deviazione standard, è necessario calcolare la media dei dati da -2 a 2 deviazioni standard.
La terza deviazione standard ha il 99,7% dei dati. Quindi, se si vuole trovare la probabilità di un atterraggio casuale nella terza deviazione standard, è necessario calcolare la media dei dati da -3 a 3 deviazioni standard.
Conclusione
Possiamo ottenere rapidamente una stima approssimativa delle probabilità dei dati attraverso la regola 68-95-99.7. È possibile utilizzare questo metodo come un semplice test quando la popolazione dei dati è normale. Tuttavia, se la popolazione dei dati non è normale, è possibile utilizzare questo metodo come test di normalità.