Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

De chi-kwadraat toets, ook geschreven als χ2 toets, is elke statistische hypothesetest waarbij de steekproefverdeling van de teststatistiek een chi-kwadraatverdeling is wanneer de nulhypothese waar is. Zonder andere kwalificatie wordt de ‘chi-kwadraat toets’ vaak als afkorting gebruikt voor Pearson’s chi-kwadraat toets. De chi-kwadraat toets wordt gebruikt om te bepalen of er een significant verschil is tussen de verwachte frequenties en de waargenomen frequenties in een of meer categorieën.in de standaardgebruiken van deze toets worden de waarnemingen gekarakteriseerd in fundamenteel ongerelateerde klassen, en er is een of andere hypothese, of toestandsonbekwame theorie, die de waarschijnlijkheid geeft dat elke waarneming in de vergelijkingsklasse valt. De motivatie achter de test is om te beoordelen hoe waarschijnlijk de percepties die worden gemaakt zijn, het accepteren van de ongeldige speculatie is geldig.

Chi-kwadraat toetsen worden regelmatig opgebouwd uit een optelsom van gekwadrateerde blunders, of door middel van de voorbeeldschommeling. Testinzichten die een chi-kwadraat overdracht nastreven komen voort uit een veronderstelling van vrije normaal gesproken verspreide informatie, die over het algemeen substantieel is vanwege een zo groot mogelijke hypothese. Een chi-kwadraat test kan worden gebruikt om te proberen de ongeldige theorie dat de informatie vrij is te verwerpen.

Evenzo wordt gedacht dat een chi-kwadraat test een test is waarbij dit asymptotisch geldig is, wat impliceert dat de inspecterende circulatie (als de ongeldige theorie geldig is) kan worden gemaakt om een chi-kwadraat overdracht te ruw als gewenst door het maken van de voorbeeldgrootte enorm genoeg.

Geschiedenis

In de negentiende eeuw werden feitelijke verklarende technieken voor het grootste deel toegepast in het onderzoek naar organische informatie en het was standaard voor analisten om te accepteren dat percepties een typische verspreiding nastreefden, bijvoorbeeld Sir George Breezy en Leraar Merriman, wiens werken werden berispt door Karl Pearson in zijn krant uit 1900.  Tot het einde van de negentiende eeuw zag Pearson de aanwezigheid van grote scheefheid in sommige organische percepties. Om de percepties te laten zien die weinig aandacht besteden aan het gewone of schuine karakter van de perceptie, bedacht Pearson, in een progressie van artikelen die van 1893 tot 1916 werden verspreid, een groep van non-stop waarschijnlijkheidsoverdrachten, die de typische verspreiding en vele schuine kredieten bevat, en stelde een strategie voor meetbaar onderzoek voor, bestaande uit het gebruik van de Pearson-circulatie om de perceptie aan te tonen en het uitspelen van de proef van fatsoen om te beslissen hoe goed het model en de perceptie echt passen.

Pearson’s chi-kwadraat test

Zie ook: Pearson’s chi-kwadraat test

In 1900 publiceerde Pearson een artikel over de χ2-test, die wordt beschouwd als een van de fundamenten van de moderne statistiek. In deze paper onderzocht Pearson de test van de goedheid van de pasvorm.

Stel dat n waarnemingen in een willekeurige steekproef van een populatie worden geclassificeerd in k klassen die elkaar uitsluiten met de respectievelijke waargenomen getallen xi (voor i = 1,2,…,k), en een nulhypothese geeft de waarschijnlijkheid pi dat een waarneming in de ith klasse valt. We hebben dus de verwachte getallen mi = npi voor alle i, waarbij

Pearson stelde voor dat, onder de omstandigheid dat de nulhypothese juist is, als n → ∞ de beperkende verdeling van de hieronder gegeven hoeveelheid de χ2-verdeling is.

Pearson beheerde het geval waar de normale nummers mi zijn enorm genoeg bekend nummers in alle cellen in de verwachting dat elke xi zou kunnen worden genomen als typisch verspreid, en kwam tot de uitkomst dat, in de cut-off, zoals n blijkt te zijn enorm, X2 streeft de χ2 toe-eigening met k – 1 graad van kans.

Desalniettemin heeft Pearson vervolgens het geval overwogen waarin de normale getallen gebaseerd waren op de parameters die uit het voorbeeld moeten worden beoordeeld en heeft hij aanbevolen dat, met de documentatie van mi als de echte verwachte getallen en m′i als de geëvalueerde verwachte getallen, het onderscheid

zal over het algemeen zeker en weinig genoeg zijn om te worden weggegooid. Uiteindelijk beweerde Pearson dat bij de buitenkans dat we X′2 als evenzeer verspreid als χ2 toe-eigening met k – 1 graad van kans beschouwden, de blunder in deze schatting geen invloed zou hebben op handige keuzes. Dit einde veroorzaakte enige onenigheid in nuttige toepassingen werd niet geregeld voor 20 jaar tot Fisher’s 1922 en 1924 papieren.

Chi-kwadraattoets voor variantie in een normale populatie

Bij de kans dat een voorbeeld van grootte n wordt genomen van een volk dat een typische toe-eigening heeft, is er op dat moment een uitkomst (zie overdracht van de voorbeeldfluctuatie) die het mogelijk maakt om te testen of de verandering van het volk een voorbesloten waarde heeft. Zo kan een assemblageprocedure in een stabiele toestand zijn geweest voor een aanzienlijk deel, waardoor een stimulans voor de schommeling in principe zonder vergissing kan worden opgelost. Veronderstel dat een variatie van de procedure wordt uitgeprobeerd, waarbij wordt aangeboden om op te stijgen naar een klein voorbeeld van n item dingen waarvan de variëteit moet worden uitgeprobeerd. De testmeting T zou in dit geval kunnen worden ingesteld op het totaal van de kwadraten over het voorbeeldmiddel, geïsoleerd door de schijnbare stimulans voor de verandering (bijvoorbeeld de stimulans om te proberen als houdbaar te zijn). Op dat moment heeft T een chi-kwadraat circulatie met n – 1 graad van kans. Als de voorbeeldgrootte bijvoorbeeld 21 is, ligt het erkenningsgebied voor T met een kritischheidsniveau van 5% ergens in het bereik van 9,59 en 34,17.