chi-squared test, scritto anche come test χ2, è qualsiasi test di ipotesi statistica in cui la distribuzione di campionamento della statistica del test è una distribuzione chi-squared quando l’ipotesi nulla è vera. Senza altre qualifiche, il ‘chi-squared test’ è spesso usato come abbreviazione di Pearson per il chi-squared test. Il test chi-squared è usato per determinare se c’è una differenza significativa tra le frequenze previste e le frequenze osservate in una o più categorie. Negli utilizzi standard di questo test, le percezioni sono caratterizzate in classi fondamentalmente non correlate, e c’è qualche ipotesi, o teoria non valida, che dà la probabilità che ogni percezione cada nella classe di confronto. La motivazione alla base del test è quella di valutare la probabilità che le percezioni che vengono fatte siano valide, accettando la speculazione non valida.

I test Chi-squared sono regolarmente costruiti a partire da un aggregato di errori al quadrato, o attraverso la fluttuazione dell’esempio. Le intuizioni del test che perseguono una trasmissione chi-squared emergono da una supposizione di informazioni gratuite normalmente diffuse, che sono in gran parte sostanziali a causa di ipotesi per quanto possibile. Un test chi-squared può essere utilizzato per tentare di respingere la teoria non valida che le informazioni sono libere.

Allo stesso modo si ritiene che il test del chi-squared sia un test in cui questo è asintoticamente valido, il che implica che la circolazione dell’ispezione (se la teoria non valida è valida) può essere fatta in modo da rendere il trasporto del chi-squared così intenso come voluto, rendendo la dimensione dell’esempio abbastanza enorme.

Storia

Nell’Ottocento, le tecniche esplicative dei fatti erano per lo più applicate nell’esame delle informazioni organiche ed era standard per gli analisti accettare che le percezioni perseguissero la tipica diffusione, ad esempio, Sir George Breezy e il maestro Merriman, le cui opere furono rimproverate da Karl Pearson nel suo saggio del 1900.  Fino alla fine dell’Ottocento, Pearson vide la presenza di enormi asimmetrie all’interno di alcune percezioni organiche. Per mostrare le percezioni con poca attenzione ad essere ordinarie o inclinate, Pearson, in una progressione di articoli distribuiti tra il 1893 e il 1916 concepì la dispersione di Pearson, un gruppo di trasmissioni di probabilità non stop, che incorpora la tipica diffusione e molti stanziamenti inclinati, e propose una strategia di esame misurabile che comprendeva l’utilizzo della circolazione di Pearson per dimostrare la percezione e giocare la prova della decenza di idoneità per decidere quanto bene il modello e la percezione si adattavano veramente.

Il test del chi-squared di Pearson

Vedi anche: Il test del chi-squared di Pearson

Nel 1900, Pearson pubblicò un articolo sul test del χ2 che è considerato uno dei fondamenti della statistica moderna. In questo articolo, Pearson ha indagato sul test di bontà della forma.

Supponiamo che n osservazioni in un campione casuale di una popolazione siano classificate in classi k reciprocamente esclusive con i rispettivi numeri osservati xi (per i = 1,2,…,k), e che un’ipotesi nulla dia la probabilità pi che un’osservazione rientri nella classe ith. Quindi abbiamo i numeri attesi mi = npi per tutti i, dove

Pearson ha proposto che, nella circostanza che l’ipotesi nulla sia corretta, in quanto n → ∞ la distribuzione limite della quantità indicata di seguito è la distribuzione χ2.

Pearson è riuscito a gestire il caso in cui i numeri normali mi sono enormi numeri abbastanza noti in tutte le celle aspettandosi che ogni xi possa essere preso come tipicamente circolato, ed è arrivato al risultato che, nel taglio, come n si rivela essere enorme, X2 persegue l’appropriazione χ2 con k – 1 grado di opportunità.

Tuttavia, Pearson ha poi considerato il caso in cui i numeri normali si sono basati sui parametri che devono essere valutati a partire dall’esempio e ha raccomandato che, con la documentazione di mi come numeri reali anticipati e m′i come numeri anticipati valutati, la distinzione

sarà generalmente sicuro e abbastanza poco da essere scartato. Alla fine, Pearson ha sostenuto che nella remota possibilità di vedere X ′2 come X ′2 disperso come χ2 di appropriazione con k – 1 grado di opportunità, l’errore in questa stima non avrebbe influenzato le scelte pratiche. Questo fine ha causato una certa contesa nelle applicazioni utili non è stato risolto per 20 anni fino ai documenti di Fisher del 1922 e del 1924.

Chi-squared test per la varianza in una popolazione normale

Nella remota possibilità che un esempio di taglia n sia preso da una popolazione che ha una tipica appropriazione, a quel punto, c’è un risultato (vedi la trasmissione della fluttuazione dell’esempio) che permette di verificare se il cambiamento della popolazione ha un valore predeterminato. Ad esempio, una procedura di montaggio può essere stata in condizioni stabili per un tratto significativo, consentendo di risolvere sostanzialmente senza errori l’incentivo alla fluttuazione. Si supponga che si stia tentando di provare una variazione della procedura, offrendo di salire a un piccolo esempio di n oggetti la cui varietà deve essere provata. La misura di prova T, in questo caso, potrebbe essere impostata come il totale dei quadrati circa la media dell’esempio, isolati dall’incentivo apparente per la variazione (ad esempio l’incentivo da provare come tenuta). A quel punto, T ha una circolazione chi-squared con n – 1 grado di opportunità. Per esempio, se la dimensione dell’esempio è 21, l’area di riconoscimento per T con un livello di criticità del 5% è da qualche parte nell’intervallo di 9,59 e 34,17.