O Desvio Padrão pode ser uma medida da abertura dos números.

O seu símbolo é σ (a letra grega sigma).

A fórmula é fácil: é a raiz da Variância. Então agora você pergunta: “O que é isso, a Variância?”.

Variância

A Variância é definida como:

A média das diferenças quadráticas em relação à Média.

Para calcular a variância, siga estes passos:

Calcular a Média (a média simples dos números)

Em seguida, para cada número: subtrair a Média e ajustar o resultado (a diferença ao quadrado).

Em seguida, calcule o típico destas diferenças quadráticas. (Porquê quadrado?)

dogs on graph shoulder heights

Exemplo

Você e os seus amigos acabam de medir a altura dos seus cães (em milímetros):

As alturas (nos ombros) são: 600mm, 470mm, 170mm, 430mm e 300mm.

Descubra a Média, a Variância, e portanto a Variância .

A sua iniciativa é procurar a Média:

dogs on graph: mean

Resposta:

Média = 600 + 470 + 170 + 430 + 3005

= 19705

= 394

por isso, a altura média (média) é de 394 mm. Vamos plotar isto na tabela:

Agora calculamos a diferença de cada cão a partir da Média:

dogs on graph: deviation

Para calcular o Desvio, pegue em cada diferença, quadrade-a, e depois faça uma média do resultado:

Variância

σ2 = 2062 + 762 + (−224)2 + 362 + (−94)25

= 42436 + 5776 + 50176 + 1296 + 88365

= 1085205

= 21704

Assim, a Variância é de 21.704

E a variância é simplesmente a raiz da variância, por isso:

Desvio padrão

σ = √21704

= 147.32…

= 147 (para o mm mais próximo)

dogs on graph: standard deviation

E o bom do desvio de qualidade é que ele é útil. Agora vamos mostrar quais as alturas que estão dentro de uma variação (147mm) da Média:

Então, usando o desvio de qualidade, temos uma forma “padrão” de saber o que é normal, e o que é tamanho ou extra pequeno.

Os Rottweilers são cães altos. E os Teckel são um pouco curtos, certo?

Usando

distrubuição normal 1 sd = 68%

Podemos esperar que cerca de 68% dos valores estejam dentro da variação mais ou menos 1 .

Leia a distribuição padrão gaussiana para saber mais.

Experimente também a Calculadora de Desvio de Qualidade.

Mas … há uma ligeira alteração com os dados da amostra

O nosso exemplo tem sido para uma População (os 5 cães são os únicos cães em que temos interesse).

Mas se a informação pode ser uma Amostra (uma selecção retirada de uma População muito maior), então o cálculo muda!

Quando você tem “N” valores de dados que são:

A População: dividir por N ao calcular a Variância (como nós fizemos)

A Amostra: dividir por N-1 ao calcular a Variância

Todos os outros cálculos permanecem equivalentes, incluindo a forma como calculámos a média.

Exemplo: se os nossos 5 cães são apenas uma amostra de uma população de cães muito maior, dividimos por 4 em vez de 5 como este:

Variância da amostra = 108,520 / 4 = 27,130

Variância da amostra = √27,130 = 165 (para o mm mais próximo)

Pense nisso como uma “correcção” quando os seus dados são apenas uma amostra.

Fórmulas

Aqui estão as 2 fórmulas, explicadas em variance Formulas, se quiser compreender melhor:

O “Desvio Padrão da População”:

square root of [ (1/N) times Sigma i=1 to N of (xi - mu)^2 ]

square root of [ (1/(N-1)) times Sigma i=1 to N of (xi - xbar)^2 ]

O “Desvio Padrão da Amostra”: Parece complicado, mas a mudança importante é

dividir por N-1 (em vez de N) ao calcular uma Variância de Amostra.