Uma hipótese estatística é uma suposição sobre um parâmetro populacional. Esta suposição pode ou não ser verdadeira. O teste de hipóteses refere-se aos procedimentos formais usados pelos estatísticos para aceitar ou rejeitar hipóteses estatísticas.

Hipóteses Estatísticas

Hipóteses Factuais

A abordagem mais ideal para decidir se uma teoria factual é genuína é olhar para toda a população. Uma vez que isso é regularmente inviável, os especialistas normalmente olham para um exemplo arbitrário da população. Caso a informação do exemplo não seja constante com a especulação factual, a teoria é descartada.

Há dois tipos de especulações factuais.

Especulação inválida. A teoria inválida, significada por Ho, é normalmente a especulação de que as percepções de exemplo resultam absolutamente da possibilidade.

Teoria eletiva. A especulação eletiva, indicada por H1 ou Ha, é a teoria de que as percepções de exemplo são impactadas por alguma razão não arbitrária.

Por exemplo, suponha que precisávamos decidir se uma moeda era razoável e ajustada. A especulação inválida pode ser de que uma grande parte das moedas flips traria Cara e Metade, em Coroa. A especulação eletiva pode ser de que o número de Cara e Coroa seria totalmente diferente. Emblematicamente, estas especulações seriam comunicadas como

Ho: P = 0,5

Ha: P ≠ 0.5

Suponhamos que virámos a moeda ao contrário várias vezes, trazendo cerca de 40 cabeças e 10 caudas. Dado este resultado, estaríamos inclinados a rejeitar a especulação inválida. Acabaríamos, em vista da prova, de que a moeda provavelmente não era razoável e ajustada.

Podemos Aceitar a Hipótese Nula?

Podemos Aceitar a Hipótese Nula?

Alguns cientistas afirmam que um teste de especulação pode ter um de dois resultados: você reconhece a teoria inválida ou você rejeita a especulação inválida. Muitos analistas, seja como for, discordam do pensamento de “tolerar a especulação inválida”. Em vez disso, eles afirmam: você rejeita a teoria inválida ou negligencia a rejeição da especulação inválida.

Porquê a qualificação entre “reconhecimento” e “incapacidade de despedimento”? A aceitação sugere que a teoria inválida é válida. A incapacidade de rejeitar sugere que a informação não é suficientemente poderosa para que possamos favorecer a especulação eletiva sobre a teoria inválida.

Testes de Hipóteses

Os analistas seguem um procedimento convencional para decidir se devem rejeitar uma teoria inválida, à luz das informações do teste. Este procedimento, chamado teste especulativo, compreende quatro etapas.

Diga as hipóteses. Isto inclui a expressão das especulações inválidas e eletivas. As especulações são expressas de forma a não terem qualquer relação com elas. Ou seja, caso uma seja válida, a outra deve ser falsa.

Pormenores de um plano de investigação. O plano de exame retrata como utilizar as informações do teste para avaliar a especulação inválida. A avaliação frequentemente se concentra em torno de uma medida de teste solitário.

Dê exemplos de informação. Descubra a estimativa da medida do teste (nota média, extensão, medida t, z-score e assim por diante.) descrita no plano de exame.

Interpretar os resultados. Aplicar o princípio de escolha retratado no plano de investigação. Na hipótese remota de que a estimativa da medida do teste é rebuscada, tendo em vista a teoria inválida, descartar a especulação inválida.

Erros de Decisão

Dois tipos de erros podem resultar de um teste teórico.

Erro do tipo I. Um erro de Tipo I acontece quando o cientista rejeita uma teoria inválida quando ela é válida. A probabilidade de submeter um erro do Tipo I é conhecida como o nível de centralidade. Esta probabilidade é também chamada de alfa e é frequentemente indicada por α.

Erro de tipo II. Um erro do Tipo II acontece quando o analista negligencia a rejeição de especulação inválida que é falsa. A probabilidade de submeter um erro do Tipo II é chamada Beta e é frequentemente entendida por β. A probabilidade de não submeter um erro do Tipo II é conhecida como o Poder do teste.

Regras de Decisão

O plano de análise inclui regras de decisão para rejeitar a hipótese nula. Na prática, os estatísticos descrevem essas regras de decisão de duas maneiras – com referência a um valor P ou com referência a uma região de aceitação.

P-valor. A força da evidência em apoio a uma hipótese nula é medida pelo valor de P. Suponha que a estatística do teste seja igual a S. O valor P é a probabilidade de se observar uma estatística de teste tão extrema quanto S, assumindo que a hipótese nula é verdadeira. Se o valor P for menor que o nível de significância, rejeitamos a hipótese nula.

Região de aceitação. A região de aceitação é um conjunto de valores. Se a estatística do teste estiver dentro da região de aceitação, a hipótese nula não é rejeitada. A região de aceitação é definida para que a chance de se cometer um erro de Tipo I seja igual ao nível de significância.

O conjunto de valores fora da região de aceitação é chamado de região de rejeição. Se a estatística do teste cair dentro da região de rejeição, a hipótese nula é rejeitada. Nesses casos, dizemos que a hipótese foi rejeitada no nível de significância α.

Estas abordagens são equivalentes. Alguns textos estatísticos utilizam a abordagem do valor P; outros utilizam a abordagem da região de aceitação. Neste site, nós tendemos a usar a abordagem da região de aceitação.

Testes de uma cauda e duas caudas

Um julgamento de uma teoria factual, onde o local de demissão está em apenas um dos lados da dispersão do exame, é conhecido como um teste de uma só vez. Por exemplo, suponha que a teoria inválida expressa que a média não é exatamente ou equivalente a 10. A especulação eletiva seria de que a média é mais proeminente do que 10. A área de demissão compreenderia um escopo de números situados no lado correto de inspecionar a disseminação; ou seja, muitos números mais notáveis do que 10.

Um julgamento de uma especulação mensurável, em que o local de demissão está nos dois lados da dispersão inspecionadora, é conhecido como um teste de dois passos. Por exemplo, suponha que a teoria inválida expressa que a média é equivalente a 10. A especulação eletiva seria que a média é inferior a 10 ou mais notável do que 10. A área de demissão compreenderia um escopo de números situados nos dois lados da fiscalização da disseminação; ou seja, o local de demissão seria composto principalmente de números menores de 10 e incompletamente de números mais notáveis do que 10