Por que a variação da amostra é dividida por n-1

Description: https://miro.medium.com/max/771/1*mnwkl_7se6A0jVQ2dVuq4w@2x.png

Se você está lendo este artigo, eu aceito que você tenha experimentado a equação da diferença de teste e perceba com o que ele fala. Em qualquer caso, continua a ser um quebra-cabeças o motivo pelo qual o denominador é (n-1), não n. Eis a razão.

Guia capítulo por capítulo

Configurações

1. Nível de Oportunidade

2. Poços de Predisposição

3. A rectificação de Bessel

Inicialmente distribuído no edenau.github.io.

Palavras

Populace: um conjunto que contém TODOS os indivíduos de uma reunião

Teste: um conjunto que contém alguns indivíduos de uma população (na verdade, um conjunto múltiplo de uma população).

Factores autónomos e indistintamente disseminados (i.i.d.) de forma arbitrária:

Uma suposição que todos os exemplos (a) são normalmente livres, e (b) têm uma dispersão de probabilidade semelhante.

Hipótese do ponto de ruptura focal:

O exame da transmissão de fatores i.i.d. irregulares inclina-se para uma apropriação típica (gaussiana) quando o tamanho do exemplo é suficientemente grande.

Valor antecipado:

Desde há algum tempo atrás, a estimativa normal de despedimentos de um julgamento semelhante é feita.

Estimador sem preconceitos:

O valor do estimador sem preconceitos é equivalente à estimativa genuína do parâmetro a ser avaliado. No final das contas, as transmissões de estimadores sem preconceitos estão focadas no valor certo.

Configurações

Dada uma grande distribuição da população gaussiana com uma população desconhecida significa μ e variância populacional σ², retiramos amostras n i.i.d. da população, de modo que para cada amostra x_i de um conjunto X,

Enquanto a estimativa normal de x_i é μ, a estimativa normal de x_i² é mais do que μ². É um resultado do mapeamento não linear da capacidade quadrada, onde o aumento de números maiores é maior do que o de números menores. Por exemplo, o conjunto (1,2,3,4,5) tem uma média 3 e a diferença 2. Pelo quadrado de cada componente, obtemos (1,4,9,16,25) com média 11=3²+2. Precisamos desta propriedade numa fase posterior.

Estimadores

Como não temos a ideia mais nebulosa sobre as propriedades genuínas da população, podemos tentar o nosso melhor para caracterizar os estimadores dessas propriedades a partir do exemplo apresentado, utilizando um desenvolvimento comparativo.

Que tal colocarmos um boné (^) em μ e σ² e chamá-los de ‘pseudo-‘ significa e flutuação, e o caracterizamos de uma forma complementar:

As definições são de certa forma discricionárias. Você pode, em princípio, caracterizá-las de uma forma muito mais extravagante e testá-las, no entanto, devemos tentar as mais diretas. Caracterizamos o pseudo-medo ^μ como o normal de todos os exemplos X. Parece que isto é o melhor que se pode esperar. Um cuidado com o pseudo-sentido propôs que ele é um estimador imparcial da média da população:

Simples. Todas as coisas consideradas, a diferença genuína de exemplo se baseia no fato de a população significar μ, o que é obscuro. Nós, nesta linha, substituímos por pseudo-meios ^μ como apareceu acima, a tal ponto que a pseudo- mudança está sujeita a pseudo-meios.

1. Nível de Oportunidade

Suponha que temos um dado justo, mas ninguém percebe que é razoável, com a exceção do Jason. Ele percebe que a população quer dizer μ (3,5 pts). Pobre William pede para obter a propriedade factual, no entanto Jason não se mexe. William precisa fazer estimativas através de testes, por exemplo, lançando os dados o mesmo número de vezes que ele pode. Ele consegue esse show na estrada várias vezes, e ele conseguiu 1 e 3 pts nas duas preliminares iniciais.

Dado que a população genuína significa μ (3,5 pts), você ainda não teria idéia do que era o terceiro rolo. No entanto, na hipótese de que você percebesse que a média do exemplo ^μ era 3,33 pts, você teria certeza de que o terceiro rolo era 6, já que (1+3+6)/3=3,33 – matemática rápida.

No final das contas, o exemplo significa incorporar precisamente um dado do conjunto de exemplos, enquanto que o povo não o faz. Desta forma, a média do exemplo dá menos um nível de oportunidade para o conjunto de exemplos.

Esta é a razão pela qual nos foi dito tipicamente, mas isto não é definitivamente uma prova cabal e completa do porquê de termos de suplantar o denominador por (n-1).

2. Fonte do Bias

Utilizando um modelo de dados semelhante. Jason conhece a média genuína μ, e por isso pode verificar a flutuação populacional utilizando a média populacional genuína (3,5 pts) e obtém uma mudança genuína de 4,25 pts². William precisa tomar a pseudo-flutuação ^μ (3,33 pts para esta situação) na determinação da pseudo-flutuação (um estimador de mudança que caracterizamos), que é de 4,22 pts².

Verdade seja dita, a pseudo-mudança deprecia consistentemente a diferença do exemplo genuíno (exceto se a média do teste concordar com a média da população), já que o pseudo-medo é o minimizador do trabalho de pseudo-flutuação, como demonstrado a seguir.

Você pode verificar este anúncio pelo teste primário subordinado, ou pelo exame dependente da convexidade da capacidade.

Isto sugere que o uso de pseudo-meios gera preconceitos. No entanto, isto não nos dá o valor do bia.

Ajuste de Bessel

Nosso único objetivo é explorar o quão unilateral é este estimador de diferença ^μ. Esperamos que a pseudo-diferença seja um estimador unilateral, pois ele pensa pouco na flutuação genuína o tempo todo, conforme mencionado anteriormente. Ao verificarmos a estimativa normal da nossa pseudo-diferença, encontramos isso:

Devagar e com cuidado. A estimativa normal de x_j x_k (como demonstrado a seguir) depende de se você está testando exemplos únicos (autônomos) onde j≠k, ou o equivalente (certamente subordinado para esta situação!) testa onde j=k. Como temos n testes, a probabilidade de obter um exemplo semelhante é 1/n.

Consequentemente, a probabilidade de obter um exemplo semelhante é 1/n,

Lembra-se do valor esperado de x_i² mencionado no início? Ao expandir ^μ, nós temos

Substitua estas fórmulas de volta, e descobrimos que a estimativa normal de pseudo-flutuação não é uma mudança populacional, no entanto (n-1)/n dela. Como o elemento de escala é menor do que 1 para todos os n positivos limitados, isto demonstra novamente que nossa pseudo-flutuação pensa pouco sobre a flutuação genuína da população.

Para afinar um estimador de flutuação imparcial, nós apenas aplicamos a retificação de Bessel que faz a estimativa normal do estimador a ser alinhado com a diferença genuína da população.

Aí tens. Nós caracterizamos s² de uma maneira com o objetivo final que é uma mudança justa de exemplo. O denominador (n-1) emerge da emenda de Bessel, que surge por causa da probabilidade de 1/n de inspecionar um exemplo similar (com substituição) em dois preliminares.s back to back.

Como o número de amostras aumenta para o infinito n→∞, o viés desaparece (n-1)/n→1, uma vez que a probabilidade de amostragem da mesma amostra em dois ensaios tende a 0.