Cuál es la regla empírica?

Esta regla en las estadísticas sugiere que cada dato que se puede observar caerá bajo tres desviaciones estándar diferentes de la media en una distribución normal. También podrías conocer la regla empírica como la regla 68-95-99.7 o la regla de los tres dígitos. De acuerdo con la regla, el 68% de los datos caerán en la primera desviación estándar, el 95% caerán en la primera y la segunda desviación y el 99,7% de los datos caerán en las tres desviaciones:
68% – (µ ± σ),
95% – (µ ± 2σ)
99,7% – (µ ± 3σ)
Si tenemos una distribución normal de los datos en un gráfico en el eje x, la curva de campana estará en el centro. La primera desviación estándar incluye la mitad positiva (µ + σ) y la mitad negativa (µ – σ). Ambas mitades de la primera desviación estándar serán colectivamente el 68%, pero si sólo consideramos la mitad positiva, sería el 34%, y la mitad negativa sería la misma. De forma similar, si consideramos la segunda desviación estándar, podemos añadir la mitad positiva de la primera y segunda desviación con el lado negativo de ambas desviaciones, lo que hace que esté completa en un 95%. El fenómeno será el mismo también en la tercera desviación.

Distribución normal

Esta es probablemente una distribución esencial de probabilidades en las estadísticas. Por ejemplo, los conjuntos de datos como el ritmo cardíaco, la presión arterial, la altura y el coeficiente intelectual formarán una curva de campana de distribución normal

La simetría de la distribución normal

La distribución normal es para las variables continuas. Las variables continuas tienen valores infinitos. Incluyen estos valores en la distribución. Una distribución normal ayuda a describir la forma en que se distribuyen las variables. La mayoría de las variables, datos u observaciones se agrupan en el centro de una distribución normal, causando un pico. Es por eso que la mayoría de las distribuciones normales tienen una forma de campana.
Además, en una distribución normal, la media, la mediana y el modo son iguales. Hay una curva en el centro, que es la media. Sin embargo, los valores izquierdo y derecho son iguales. Se puede definir la distribución normal por la media y la desviación estándar. Estos son los dos factores esenciales que afectan a la curva. El 68 por ciento del área cae bajo una sola desviación estándar de la media.

Parámetros de la distribución normal

Significa

Podemos encontrar la media del conjunto de datos sumando todos los valores y dividiendo el total por el número de valores.

Mediana

Cuando se ordena el conjunto de datos desde el más bajo al más alto, el valor medio es la mediana.

Modo

El modo es ese valor que aparece muy a menudo en el conjunto de datos.

Desviación estándar

La desviación estándar mide cuán difundidos están los valores de los datos. El símbolo de la desviación estándar es sigma. La desviación estándar es sólo la raíz cuadrada de las desviaciones. Por ejemplo, cuando se mide la tasa anual del rendimiento de la inversión, se puede encontrar la volatilidad histórica de la inversión. Este enfoque es una medida estadística o desviación estándar.

Varianzas

Las variaciones también miden la amplitud de los valores. Sin embargo, este término se refiere a cuán lejos están los números del conjunto de datos de la media y otros números

Z-Scores

La puntuación Z es una representación numérica de la relación entre la media de un grupo y el valor. Puedes calcular el Z-score como desviaciones estándar con la ayuda de la media. Cuando el puntaje Z es igual a cero, el puntaje de la media y el puntaje de los datos son iguales. La puntuación Z puede ser negativa y positiva. Si el puntaje Z es negativo, está por debajo de la media, y si el puntaje Z está por encima de la media, es positivo.

Comprensión del concepto de la regla 68-95-99.7

La distribución normal de los datos se relaciona comúnmente con la regla 68-95-99.7. Se puede encontrar el 68% de los datos en la primera desviación estándar, el 95% de los datos en la segunda desviación, y el 99,7% de los datos en la tercera desviación de la media.

Función de densidad de probabilidad

Para averiguar el porcentaje, deberías saber lo que significa la función de densidad de probabilidad o PDF. Con la ayuda de la PDF, puedes especificar la probabilidad de la variable aleatoria que cae en un rango específico de valores en lugar de tomar cualquier valor diferente. Puedes calcular la probabilidad sacando la integral de la PDF de la variable en el rango. Esto significa que el área está en la función de densidad pero entre los valores más altos y más bajos y sobre el eje horizontal del rango.

En la primera desviación estándar, hay un 68% de los datos. Así que si quieres encontrar la probabilidad de aterrizaje del punto de datos aleatorios en la primera desviación estándar, necesitas calcular la media de los datos de -1 a 1 desviación estándar.

En la segunda desviación estándar, hay un 95% de los datos. Así que si quieres encontrar la probabilidad de aterrizaje del punto de datos aleatorios en la segunda desviación estándar, necesitas calcular la media de los datos de -2 a 2 desviaciones estándar.

La tercera desviación estándar tiene el 99,7% de los datos. Así que si quieres encontrar la probabilidad de aterrizaje del punto de datos aleatorios en la tercera desviación estándar, necesitas calcular la media de los datos de -3 a 3 desviaciones estándar.

Conclusión

Podemos obtener rápidamente una estimación de probabilidad aproximada de los datos mediante la regla 68-95-99,7. Se puede utilizar este método como una simple prueba cuando la población de los datos es normal. Sin embargo, si la población de los datos no es normal, se puede utilizar este método como una prueba de normalidad.