Si está leyendo este artículo, acepto que ha experimentado la ecuación de la diferencia de prueba y se da cuenta de lo que dice. En cualquier caso, sigue siendo un rompecabezas que por qué el denominador es (n-1), no n. Aquí está la razón.

Guía capítulo por capítulo

Ajustes

1. Nivel de oportunidad

2. Fuente de predisposición

3. Rectificación de Bessel

Inicialmente distribuido en edenau.github.io.

Palabra

Populace: un conjunto que contiene TODOS los individuos de una reunión

Prueba: un conjunto que contiene unos pocos individuos de una población (de hecho, un subconjunto múltiple de una población)

Factores arbitrarios autónomos e indistintamente difundidos (i.i.d.):

Se supone que todos los ejemplos a) son comúnmente libres y b) tienen una dispersión de probabilidad similar.

Hipótesis de punto de ruptura focal:

La transmisión examinadora de los factores irregulares del i.i.d. se inclina hacia una apropiación típica (gaussiana) cuando el tamaño del ejemplo es lo suficientemente grande.

Valor anticipado:

Desde hace bastante tiempo se hace una estimación normal de las redundancias de un ensayo similar.

Estimador sin prejuicios:

El estimador sin prejuicios que se basa en el valor es equivalente a la estimación genuina del parámetro que se está evaluando. Al final del día, los estimadores sin prejuicios se centran en el valor correcto.

Ajustes

Dada una gran distribución de la población gaussiana con una media de población desconocida μ y la varianza de la población σ², extraemos muestras n.i.d. de la población, de manera que para cada muestra x_i de un conjunto X,

Mientras que la estimación normal de x_i es μ, la estimación normal de x_i² es más que μ². Es el resultado de la cartografía no recta de la capacidad cuadrada, donde el aumento de los números más grandes es mayor que el de los números más pequeños. Por ejemplo, el conjunto (1,2,3,4,5) tiene una media de 3 y la diferencia 2. Al cuadrar cada componente, obtenemos (1,4,9,16,25) con una media 11=3²+2. Necesitamos esta propiedad en una etapa posterior.

Estimadores

Como no tenemos la menor idea de las propiedades genuinas de la población, podemos intentar hacer lo mejor para caracterizar los estimadores de esas propiedades a partir del ejemplo establecido utilizando un desarrollo comparativo.

¿Qué tal si ponemos un tope (^) en μ y σ² y los llamamos ‘pseudo-‘ media y fluctuación, y lo caracterizamos de manera acompañante:

Las definiciones son algo discrecionales. En principio, se pueden caracterizar de manera mucho más elegante y probarlas, sin embargo, debemos intentar las más directas. Caracterizamos el pseudo-significado ^μ como el normal de todos los ejemplos X. Parece que esto es tan bueno como se puede esperar. Un rápido cuidado con el pseudo-significado propuesto que es un estimador imparcial de la media de la población:

Simple. Considerando todas las cosas, la diferencia del ejemplo genuino se basa en el medio de la población μ, que es oscuro. Nosotros, en esta línea, lo sustituimos por el pseudo-significado ^μ como apareció anteriormente, hasta tal punto que el pseudo-cambio está sujeto a pseudo-significado.

1. Nivel de oportunidad

Supongamos que tenemos un trato justo, pero nadie se da cuenta de que es razonable, con la excepción de Jason. Se da cuenta de que la población significa μ (3.5 pts). El pobre William pide que le den los hechos, pero Jason no se mueve. William necesita hacer estimaciones mediante pruebas, por ejemplo, tirando los dados el mismo número de veces que pueda. Él consigue este espectáculo en la carretera varias veces, y obtuvo 1 y 3 pts en los dos preliminares iniciales.

Dado el genuino medio de la población μ (3.5 pts), incluso ahora no tendrías ni idea de cuál fue el tercer rollo. Sin embargo, en la remota posibilidad de que te dieras cuenta de que la media del ejemplo ^μ era de 3,33 puntos, estarías seguro de que el tercer rollo era 6, ya que (1+3+6)/3=3,33 – matemáticas rápidas.

Al final del día, el ejemplo significa que encarna precisamente un dato del conjunto de ejemplos, mientras que el pueblo significa que no. De esta manera, la media del ejemplo da un nivel menos de oportunidad al conjunto de ejemplos.

Esta es la razón por la que se nos dijo típicamente, sin embargo, esto definitivamente no es una prueba contundente y completa de por qué necesitamos suplantar el denominador por (n-1).

2. Fuente de sesgo

Utilizando un modelo de dados similar. Jason conoce la media genuina μ, a lo largo de estas líneas puede determinar la fluctuación de la población utilizando la media genuina de la población (3,5 pts) y obtiene un cambio genuino de 4,25 pts². William necesita tomar la seudo-media ^μ (3,33 pts para esta situación) para determinar la seudo-fluctuación (un estimador de cambio que hemos caracterizado), que es 4,22 pts².

A decir verdad, el seudocambio menosprecia sistemáticamente la diferencia del ejemplo genuino (excepto si la media de la prueba concuerda con la media de la población), ya que el seudocambio es el minimizador del trabajo de seudofluctuación como se demuestra a continuación.

Puede comprobar este anuncio mediante la prueba de subordinación primaria, o mediante un examen dependiente de la convexidad de la capacidad.

Esto sugiere que el uso de pseudo-medio genera un sesgo. Sin embargo, esto no nos da el valor de bia.

El ajuste de Bessel

Nuestro único objetivo es explorar cuán unilateral es este estimador de diferencias ^μ. Esperamos que la seudo-diferencia sea un estimador unilateral, ya que piensa poco en la fluctuación genuina todo el tiempo como se ha mencionado antes. Al comprobar la estimación normal de nuestra seudo-diferencia, encontramos que:

Despacio y con cuidado. La estimación normal de x_j x_k (como se demuestra a continuación) depende de si se están probando ejemplos únicos (autónomos) donde j≠k, o el equivalente (¡sin duda subordinado para esta situación!) prueba donde j=k. Puesto que tenemos n pruebas, la probabilidad de obtener un ejemplo similar es de 1/n. En consecuencia,

¿Recuerdas el valor esperado de x_i² mencionado al principio? Al expandir ^μ, tenemos

Sustituye estas fórmulas de nuevo, y descubrimos que la estimación normal de la seudo-fluctuación no es el cambio de población, sin embargo (n-1)/n de ella. Dado que el elemento de escala es menor que 1 para todas las n positivas limitadas, esto demuestra una vez más que nuestro seudo-cambio piensa poco en la fluctuación de la población genuina.

Para afinar un estimador de fluctuación imparcial, sólo aplicamos la rectificación de Bessel que hace que la estimación normal del estimador se alinee con la diferencia de población genuina.

Ahí lo tienes. Caracterizamos s² de una manera con el objetivo final de que sea un ejemplo de cambio justo. El denominador (n-1) surge de la enmienda de Bessel, que se produce por la probabilidad 1/n de inspeccionar un ejemplo similar (con sustitución) en dos preliminares espalda con espalda.

A medida que el número de muestras aumenta hasta el infinito n→∞, el sesgo desaparece (n-1)/n→1, ya que la probabilidad de muestreo de la misma muestra en dos ensayos tiende a 0.