Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Uma exceção é um pouco de informação que é um bom caminho irregular a partir de diferentes focos. No final do dia, são informações que estão fora das diferentes qualidades do conjunto. Na hipótese de você ter Pinóquio em uma classe de crianças, o comprimento do seu nariz contrastado com o de crianças diferentes seria uma exceção.

Neste arranjo de números irregulares, 1 e 201 são anomalias:

1, 99, 100, 101, 103, 109, 110, 201

“1” é um valor incrivelmente baixo e “201” é um valor muito alto.

As exceções geralmente não são tão evidentes assim. Suponha que você tenha recebido os cheques de acompanhamento há um mês:

$225, $250, $25, $235.

O seu cheque normal é $135. Seja como for, esse pequeno cheque ($25) pode ser porque você tirou algum tempo de folga, então uma semana após semana cheques normais de $135 é tudo menos uma impressão genuína do valor que você ganhou. Yoru normal está na realidade mais perto de $237 no caso de você tirar a anomalia ($25) do conjunto.

Obviamente, tentar descobrir anomalias não é geralmente tão simples assim. Sua coleção informativa pode se assemelhar a isto:

61, 10, 32, 19, 22, 29, 36, 14, 49, 3.

Você poderia especular que 3 podem ser uma exceção e talvez 61. Seja como for, você não estaria certo: 61 é a principal exceção neste índice informativo.

Um gráfico de caixa e cerdas (boxplot) freqüentemente mostram anomalias:

Seja como for, você pode não se aproximar de um contêiner e de um diagrama de pêlos. Além disso, independentemente de você fazer, alguns boxplots podem não mostrar anomalias. Por exemplo, este diagrama tem cerdas que se conectam com as anomalias incorporadas:

Como Encontrar Outliers com o Método Tukey

A estratégia de Tukey para descobrir anomalias utiliza a faixa interquartil para peneirar números enormes ou extremamente pequenos. É, para todos os efeitos, equivalente ao método acima, mas você pode ver as receitas compostas de forma marginalmente distinta e o fraseado também é algo extraordinário. Por exemplo, a técnica de Tukey utiliza a idéia de “parede”.

As equações são:

Anomalias baixas = Q1 – 1,5(Q3 – Q1) = Q1 – 1,5(IQR)

Anomalias altas = Q3 + 1,5(Q3 – Q1) = Q3 + 1,5(IQR)

Onde:

Q1 = primeiro quartil

Q3 = terceiro quartil

IQR = Execução interquartílica

Estas condições dão aos dois estima, ou “cercas”. Você pode considerá-las como uma cerca que protege as exceções da totalidade das qualidades que estão contidas na maior parte das informações.

Pergunta de teste: Utilize a estratégia de Tukey para descobrir exceções para o arranjo de informações de acompanhamento: 1,2,5,6,7,9,12,15,18,19,38.

Etapa 1: Descubra a Interquartile go:

Localizar o meio: 1,2,5,6,7,9,12,15,18,19,38.

Colchetes à volta dos números acima e abaixo do meio – torna o Q1 e o Q3 mais simples de descobrir.

(1,2,5,6,7),9,(12,15,18,19,38)

Descubra o Q1 e o Q3. Q1 pode ser pensado como um meio na metade inferior da informação. Q3 pode ser pensado como um meio para a porção superior da informação.

(1,2,5,6,7), 9, ( 12,15,18,19,38). T1=5 e T3=18.

Subtraia o Q1 do Q3. 18-5=13.

Etapa 2: Figura 1.5 * IQR:

1,5 * IQR = 1,5 * 13 = 19,5

Etapa 3: Subtraia do Q1 para obter sua cerca inferior:

5 – 19.5 = – 14.5

Etapa 4: Adicione ao Q3 para obter sua cerca superior:

18 + 19.5 = 37.5.

Passo 5: Adicione sua parede às suas informações para distinguir as exceções:

(- 14.5) 1,2,5,6,7,9,12,15,18,19,(37.5),38.

Qualquer coisa fora da parede é uma anomalia. Para este índice informativo, 38 é a principal anomalia.

Esse é o meio pelo qual descobrir exceções com a técnica Tukey!

Voltar ao Topo

Instruções para Descobrir Anomalias com Estratégias de Ponta

ESD resumido

Teste do Grubbs.

Teste Q do Dixon.

Teste Tau Thompson Tau Alterado

O Paradigma de Penetrar