Uma exceção é um pouco de informação que é um bom caminho irregular a partir de diferentes focos. No final do dia, são informações que estão fora das diferentes qualidades do conjunto. Na hipótese de você ter Pinóquio em uma classe de crianças, o comprimento do seu nariz contrastado com o de crianças diferentes seria uma exceção.
Neste arranjo de números irregulares, 1 e 201 são anomalias:
1, 99, 100, 101, 103, 109, 110, 201
“1” é um valor incrivelmente baixo e “201” é um valor muito alto.
As exceções geralmente não são tão evidentes assim. Suponha que você tenha recebido os cheques de acompanhamento há um mês:
$225, $250, $25, $235.
O seu cheque normal é $135. Seja como for, esse pequeno cheque ($25) pode ser porque você tirou algum tempo de folga, então uma semana após semana cheques normais de $135 é tudo menos uma impressão genuína do valor que você ganhou. Yoru normal está na realidade mais perto de $237 no caso de você tirar a anomalia ($25) do conjunto.
Obviamente, tentar descobrir anomalias não é geralmente tão simples assim. Sua coleção informativa pode se assemelhar a isto:
61, 10, 32, 19, 22, 29, 36, 14, 49, 3.
Você poderia especular que 3 podem ser uma exceção e talvez 61. Seja como for, você não estaria certo: 61 é a principal exceção neste índice informativo.
Um gráfico de caixa e cerdas (boxplot) freqüentemente mostram anomalias:

Seja como for, você pode não se aproximar de um contêiner e de um diagrama de pêlos. Além disso, independentemente de você fazer, alguns boxplots podem não mostrar anomalias. Por exemplo, este diagrama tem cerdas que se conectam com as anomalias incorporadas:

Como Encontrar Outliers com o Método Tukey

A estratégia de Tukey para descobrir anomalias utiliza a faixa interquartil para peneirar números enormes ou extremamente pequenos. É, para todos os efeitos, equivalente ao método acima, mas você pode ver as receitas compostas de forma marginalmente distinta e o fraseado também é algo extraordinário. Por exemplo, a técnica de Tukey utiliza a idéia de “parede”.
As equações são:
Anomalias baixas = Q1 – 1,5(Q3 – Q1) = Q1 – 1,5(IQR)
Anomalias altas = Q3 + 1,5(Q3 – Q1) = Q3 + 1,5(IQR)
Onde:
Q1 = primeiro quartil
Q3 = terceiro quartil
IQR = Execução interquartílica
Estas condições dão aos dois estima, ou “cercas”. Você pode considerá-las como uma cerca que protege as exceções da totalidade das qualidades que estão contidas na maior parte das informações.
Pergunta de teste: Utilize a estratégia de Tukey para descobrir exceções para o arranjo de informações de acompanhamento: 1,2,5,6,7,9,12,15,18,19,38.
Etapa 1: Descubra a Interquartile go:
Localizar o meio: 1,2,5,6,7,9,12,15,18,19,38.
Colchetes à volta dos números acima e abaixo do meio – torna o Q1 e o Q3 mais simples de descobrir.
(1,2,5,6,7),9,(12,15,18,19,38)
Descubra o Q1 e o Q3. Q1 pode ser pensado como um meio na metade inferior da informação. Q3 pode ser pensado como um meio para a porção superior da informação.
(1,2,5,6,7), 9, ( 12,15,18,19,38). T1=5 e T3=18.
Subtraia o Q1 do Q3. 18-5=13.
Etapa 2: Figura 1.5 * IQR:
1,5 * IQR = 1,5 * 13 = 19,5
Etapa 3: Subtraia do Q1 para obter sua cerca inferior:
5 – 19.5 = – 14.5
Etapa 4: Adicione ao Q3 para obter sua cerca superior:
18 + 19.5 = 37.5.
Passo 5: Adicione sua parede às suas informações para distinguir as exceções:
(- 14.5) 1,2,5,6,7,9,12,15,18,19,(37.5),38.
Qualquer coisa fora da parede é uma anomalia. Para este índice informativo, 38 é a principal anomalia.
Esse é o meio pelo qual descobrir exceções com a técnica Tukey!
Voltar ao Topo
Instruções para Descobrir Anomalias com Estratégias de Ponta
ESD resumido
Teste do Grubbs.
Teste Q do Dixon.
Teste Tau Thompson Tau Alterado
O Paradigma de Penetrar