A P estima, ou probabilidade determinada, é a probabilidade de encontrar os resultados observados, ou progressivamente extraordinários, quando a teoria inválida (H0) de uma questão de exame é válida – o significado de “ultrajante” depende de como a especulação está sendo tentada. P é adicionalmente descrito em relação à rejeição de H0 quando, na realidade, é óbvio, em qualquer caso, é tudo menos uma probabilidade imediata deste estado.
A teoria inválida é a especulação geral de “nenhuma distinção”, por exemplo, nenhum contraste entre as pressões sanguíneas no grupo An e nos cachos B. Caracterize a especulação inválida para cada pergunta de exame claramente antes do início da sua investigação.
A principal circunstância em que você deve utilizar um valor P desigual é o ponto em que uma grande alteração em um curso surpreendente não teria positivamente nenhum significado para o seu exame. Esta circunstância é incomum; na hipótese remota de que você esteja em qualquer incerteza, nesse ponto utilize um P de dois lados.
O termo nível de notabilidade (alfa) é utilizado para aludir a uma probabilidade previamente escolhida e a expressão “P estima” é utilizada para demonstrar uma probabilidade que você calcula após um determinado relatório.
A teoria eletiva (H1) é algo contrário à especulação inválida; em termos de linguagem simples, esta é normalmente a teoria que você decidiu examinar. Por exemplo, a pergunta “existe um enorme (não por causa da possibilidade) contraste na pressão sanguínea entre os cachos An e B na hipótese de darmos ao cacho A a medicação de teste e recolher B um comprimido de açúcar?” e a especulação eletiva é “existe uma distinção na pressão sanguínea entre os cachos An e B na hipótese de darmos ao cacho A a medicação de teste e recolher B um comprimido de açúcar”.
Na hipótese de o seu P valor não ser exatamente o nível de grandeza escolhido, nesse ponto você rejeita a teoria inválida, por exemplo, reconhece que o seu exemplo dá provas sensatas para ajudar a especulação eletiva. Ela não deduz um contraste “significativo” ou “significante”; isso é para você escolher ao considerar esta pertinência da realidade atual do seu resultado.
A decisão do nível de criticidade em que se demite o H0 é auto-afirmativa. Normalmente os níveis de 5% (menos de 1 em 20 possibilidades de estar fora da base), 1% e 0,1% (P < 0,05, 0,01 e 0,001) têm sido utilizados. Estes números podem dar uma sensação equivocada de que tudo está bem e bem.
No mundo perfeito, teríamos a opção de caracterizar um exemplo “consumadamente” irregular, o teste mais adequado e um final completo. Basicamente, não podemos. O que podemos fazer é tentar atualizar todas as fases do nosso exame para limitar as fontes de vulnerabilidade. Ao exibir a estima P algumas reuniões pensam que é de apoio utilizar o quadro de referência de classificação de balas, assim como citar a estima P:
P < 0.05 *
P < 0.01 **
P < 0.001
A maior parte dos criadores aludem a um tamanho mensurável como P < 0,05 e excepcionalmente crítico como P < 0,001 (menos do que uma de cada mil possibilidades de estar fora da base).
O marco de referência mantém uma distância estratégica do termo “enorme”. Se não for muito incómodo, não obstante, numerosos analistas não se importam com o quadro de marcas de referência quando este é utilizado sem demonstrar estima P. Como orientação geral, no caso de se poder citar uma P estima cuidadosa, nesse ponto o faça. Você também pode precisar aludir a uma citada estima P cuidadosa como uma história de conteúdo de boletim de referência ou tabelas de complexidades em algum outro lugar em um relatório.
Agora, uma palavra sobre o engano. O erro do tipo I é a falsa rejeição da especulação inválida e o erro do tipo II é o reconhecimento falso da teoria inválida. Como um diário guiado: acreditar que a nossa sociedade crítica demite antes de reconhecer.
O nível de notabilidade (alfa) é a probabilidade de erro do tipo I. A intensidade de um teste é uma menos a probabilidade de erro do tipo II (beta). A potência deve ser amplificada ao escolher técnicas factuais. Na hipótese de que você precisa medir os tamanhos dos testes, nesse ponto você deve ver a totalidade dos termos referenciados aqui.
A tabela em anexo mostra a ligação entre a potência e o erro nos testes teóricos:
DECISÃO | ||
VERDADE | Aceite H0: | Rejeitar H0: |
H0 é verdade: | decisão correcta P | erro tipo I P |
1-alfa | alfa (significado) | |
H0 é falso: | erro tipo II P | decisão correcta P |
beta | 1-beta (potência) | |
H0 = hipótese nula | ||
P = probabilidade |
Se você estiver interessado em mais detalhes sobre probabilidade e teoria da amostragem neste momento, consulte um dos textos gerais listados na seção de referência.
Você deve entender os intervalos de confiança se você pretende citar valores P em relatórios e papéis. Os pareceristas estatísticos de revistas científicas esperam que os autores citam intervalos de confiança com maior destaque do que os valores de P.
Notas sobre erro de Tipo I:
é a rejeição incorrecta da hipótese nula
a probabilidade máxima é definida antecipadamente como alfa
não é afetado pelo tamanho da amostra, pois é definido com antecedência
aumenta com o número de testes ou pontos finais (ou seja, fazer 20 rejeições de H0 e 1 é provável que seja erroneamente significativo para alfa = 0,05)
Notas sobre o erro Tipo II:
é a aceitação incorrecta da hipótese nula
probabilidade é beta
beta depende do tamanho da amostra e do alfa
não pode ser estimado, excepto em função do verdadeiro efeito populacional
O beta fica menor à medida que o tamanho da amostra fica maior
O beta fica menor à medida que o número de testes ou pontos finais aumenta