Il valore P, originariamente calcolato come probabilità, è la probabilità di trovare i risultati osservati, o risultati più estremi, quando l’ipotesi nulla (H0) di una domanda di studio è vera – questa definizione di “estremo” dipende da come l’ipotesi viene testata. P è anche descritta in termini di rifiuto di H0 quando è effettivamente vera, ma non è una probabilità diretta di questo stato.

L’ipotesi nulla è di solito un’ipotesi “nessuna differenza”, ad esempio nessuna differenza tra le pressioni sanguigne del gruppo A e del gruppo B. Definire chiaramente un’ipotesi nulla per ogni domanda di studio prima dell’inizio dello studio.

L’unica situazione in cui si dovrebbe utilizzare un valore P unilaterale è quando un grande cambiamento in una direzione inaspettata non avrebbe assolutamente alcuna rilevanza per lo studio. Una situazione di questo tipo è insolita; in caso di dubbio, utilizzate un valore P bilaterale.

Usate il termine livello di significatività (alfa) come indicazione di una probabilità pre-celta e il termine valore P viene usato per indicare una probabilità che viene calcolata dopo un dato studio.

L’ipotesi alternativa (H1) è l’opposto dell’ipotesi nulla; in altre parole, questa è di solito l’ipotesi che si vuole indagare. Per esempio, si chiede “c’è una differenza significativa (non dovuta al caso) nella pressione sanguigna tra i gruppi A e B se diamo al gruppo A il farmaco di prova e al gruppo B una pillola di zucchero?” e l’ipotesi alternativa è “c’è una differenza nella pressione sanguigna tra i gruppi A e B se diamo al gruppo A il farmaco di prova e al gruppo B una pillola di zucchero”.

Se il vostro valore P è inferiore al livello di significatività scelto, allora rifiutate l’ipotesi nulla, cioè accettate che il vostro campione dia una prova ragionevole a sostegno dell’ipotesi alternativa. Ciò NON implica una differenza “significativa” o “importante”; è vostra responsabilità decidere quando considerare la rilevanza del vostro risultato nel mondo reale.

La scelta del livello di significatività al quale rifiutate H0 è arbitraria. Convenzionalmente, sono stati utilizzati i livelli del 5% (meno di 1 probabilità su 20 di sbagliare), 1% e 0,1% (P < 0,05, 0,01 e 0,001). Questi numeri possono dare un falso senso di sicurezza.

Se fossimo nel mondo ideale, saremmo in grado di definire un campione “perfettamente” casuale, il test più appropriato e una conclusione definitiva. Ma non ci riusciamo. Quello che possiamo fare è cercare di ottimizzare tutte le fasi della nostra ricerca per ridurre al minimo le fonti di incertezza. Nel presentare i valori P, alcuni gruppi trovano utile l’uso del sistema di valutazione asterisco e la citazione del valore P:

P < 0.05 *

P < 0.01 **

P < 0.001

La maggior parte degli autori si riferisce a P < 0,05 che è statisticamente significativo e P < 0,001 che è statisticamente molto significativo (meno di una possibilità su mille di sbagliare).

L’asterisco del sistema evita il termine “significativo”. Si noti, tuttavia, che molti statistici non apprezzano il sistema asterisco quando viene utilizzato senza mostrare i valori P. Come regola generale, se si può citare un valore P esatto, allora fatelo. Si potrebbe anche voler fare riferimento ad un valore P esatto citato come asterisco nella narrazione testuale o nelle tabelle di contrasto in altre parti di un rapporto.

Una parola sull’errore a questo punto. L’errore di tipo I è il falso rifiuto dell’ipotesi nulla e l’errore di tipo II è la falsa accettazione dell’ipotesi nulla. Come promemoria per aiutare: pensare che la nostra cinica società rifiuta prima di accettare.

Il livello di significato (alfa) è la probabilità di errore di tipo I. La potenza di un test è una meno la probabilità di errore di tipo II (beta). La potenza dovrebbe essere massimizzata nella scelta dei metodi statistici. Se si vuole stimare la dimensione del campione, è necessario comprendere tutti i termini qui menzionati.

Questa tabella mostra la relazione tra potenza ed errore nel test di ipotesi:

DECISION
TRUTH Accept H0: Reject H0:
H0 is true: correct decision P type I error P
1-alpha alpha (significance)
H0 is false: type II error P correct decision P
beta 1-beta (power)
H0 = null hypothesis
P = probability

Se siete interessati a maggiori dettagli sulla probabilità e sulla teoria del campionamento, fate riferimento a uno dei testi generali elencati nella sezione di riferimento, se a questo punto siete interessati a maggiori dettagli sulla probabilità e sulla teoria del campionamento.

È necessario comprendere gli intervalli di confidenza se si intende citare i valori P nei rapporti e nei documenti. I referenti statistici delle riviste scientifiche si aspettano che gli autori citino gli intervalli di confidenza in modo più prominente rispetto ai valori P.