Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Los estadísticos utilizan medidas resumidas para describir el grado de variabilidad o difusión de un conjunto de datos. Las medidas de variabilidad más comunes son el rango, el rango intercuartílico (IQR), la varianza y la desviación estándar.

La gama

La gama es la distinción entre las cualidades más grandes y las más pequeñas en muchas cualidades.

Por ejemplo, piense en los números que acompañan: 1, 3, 4, 5, 5, 6, 7, 11. Para esta disposición de números, el rango sería 11 – 1 o 10.

El rango intercuartílico (IQR)

El intercuartil go (IQR) es una proporción de la variabilidad, a la luz de la separación de un índice de información en cuartiles.

Los cuartiles separan un índice informativo solicitado de posición en cuatro partes equivalentes. Las cualidades que separan cada parte se conocen como los cuartiles principal, segundo y tercero; y se indican por Q1, Q2 y Q3, individualmente..

Q1 es el valor “medio” de la primera mitad del conjunto de datos ordenados.

Q2 es el valor medio del conjunto.

Q3 es el valor “medio” en la segunda mitad del conjunto de datos ordenados.

El rango intercuartílico es equivalente a Q3 menos Q1. Por ejemplo, piense en los números que acompañan: 1, 2, 3, 4, 5, 6, 7, 8

Q2 es el medio de todo el índice de información, el valor medio. En este modelo, tenemos un número par de puntos de datos, así que el medio es equivalente a la normalidad de las dos cualidades del centro. De esta manera, Q2 = (4 + 5)/2 o Q2 = 4,5. Q1 es el centro de un incentivo en la parte principal del índice de información. Q1 es el valor medio en la primera mitad del conjunto de datos. Como hay un número par de puntos de datos en la primera mitad del conjunto de datos, el valor medio es el promedio de los dos valores medios; es decir, Q1 = (2 + 3)/2 o Q1 = 2,5. Q3 es el centro de un incentivo en el segundo 50% del conjunto de datos. Una vez más, dado que el segundo 50% de la colección de información tiene un gran número de percepciones, el valor central es el normal de las dos cualidades centrales; es decir, Q3 = (6 + 7)/2 o Q3 = 6,5. El rango intercuartílico es Q3 menos Q1, por lo que IQR = 6.5 – 2.5 = 4.

Fíjese que este procedimiento dividió el índice de información en cuatro piezas de tamaño equivalente. El segmento inicial comprende de 1 y 2; la sección subsiguiente, 3 y 4; la tercera sección, 5 y 6; y la cuarta sección, 7 y 8.

La variación

En una población, la variación es la desviación cuadrada normal de la media de la población, caracterizada por la receta que la acompaña:

σ2 = Σ ( Xi – μ )2/N

donde σ2 es la variación de la población, μ es la media de la población, Xi es el i-ésimo componente de la población, y N es el número de componentes de la población.

Las percepciones de un ejemplo arbitrario básico pueden utilizarse para evaluar la diferencia de una población. Por esta razón, la varianza de la muestra se caracteriza por una fórmula un tanto única, y utiliza una notación ligeramente diferente:

s2 = Σ ( xi – x )2/( n – 1 )

donde s2 es el cambio del ejemplo, x es la media del ejemplo, xi es el i-ésimo componente del ejemplo, y n es el número de componentes del ejemplo. Utilizando esta fórmula, la diferencia del ejemplo puede verse como un indicador imparcial de la fluctuación de la población genuina. En este sentido, en la remota posibilidad de tener que evaluar una oscura diferencia de población, a la luz de la información de un ejemplo irregular directo, ésta es la receta a utilizar.

La desviación estándar

La desviación estándar es la base cuadrada del cambio. A lo largo de estas líneas, la desviación estándar de una población es:

σ = sqrt [ σ2 ] = sqrt [ Σ ( Xi – μ )2/N ]

donde σ es la desviación estándar de la población, μ es la media de la población, Xi es el i-ésimo componente de la población, y N es el número de componentes de la población.

Los analistas suelen utilizar ejemplos irregulares básicos para calibrar la desviación estándar de una población, a la luz de la información de las pruebas. Dando un ejemplo arbitrario directo, el mejor indicador de la desviación estándar de una población es:

s = sqrt [ s2 ] = sqrt [ Σ ( xi – x )2/( n – 1 ) ]

donde s es la desviación estándar del ejemplo, x es la media del ejemplo, xi es el i-ésimo componente del ejemplo, y n es el número de componentes del ejemplo.

Impacto del cambio de unidades

De vez en cuando, los especialistas cambian de unidad (de minutos a horas, de pies a metros, etc.). Así es como las medidas de variabilidad se ven afectadas cuando cambiamos de unidad.

En la remota posibilidad de que añadas una constante a cada estima, la separación entre las cualidades no cambia. Como resultado, todas las medidas de variabilidad (rango, rango intercuartílico, desviación estándar y varianza) permanecen iguales.

Por otra parte, supongamos que aumenta cada uno de los incentivos de forma consistente. Esto tiene el impacto de aumentar el rango, el ir intercuartil (IQR), y la desviación estándar por ese consistente. Tiene un impacto mucho más prominente en el cambio. Aumenta la diferencia por el cuadrado de la constante.

Languages

Weekly newsletter

No spam. Just the latest releases and tips, interesting articles, and exclusive interviews in your inbox every week.