Als u dit artikel doorleest, accepteer ik dat u de vergelijking van het testverschil heeft ervaren en zich realiseert waar het voor staat. In ieder geval blijft het een puzzel waarom de noemer (n-1) is, niet n. Hier is de reden.

Hoofdstuk voor hoofdstuk gids

Instellingen

1. 2. Niveau van de opportuniteit

2. 2. Wellspring of Predispositie

3. 3. Rectificatie van Bessel

In eerste instantie gedistribueerd op edenau.github.io.

Wording

Populace: een set die ALLE individuen van een bijeenkomst bevat

Test: een set die enkele individuen van een populatie bevat (in feite een multi-subset van een populatie)

Autonome en niet te onderscheiden (i.e.g.) arbitraire factoren:

Een veronderstelling dat alle voorbeelden (a) algemeen vrij zijn, en (b) een vergelijkbare waarschijnlijkheid van verspreiding hebben.

Focale breekpunt hypothese:

Het onderzoek naar de overdracht van i.i.d. onregelmatige factoren neigt naar een typische (Gaussische) toe-eigening wanneer de voorbeeldgrootte groot genoeg is.

Verwachte waarde:

Sinds een hele tijd geleden loopt de normale schatting van de ontslagen van een soortgelijke proef.

Onbevooroordeelde schatter:

De onbevooroordeelde schattingswaarde waarop wordt vertrouwd is gelijk aan de werkelijke schatting van de te beoordelen parameter. De overdrachten van onbevooroordeelde schatters zijn uiteindelijk gericht op de juiste waarde.

Instellingen

Gezien een grote Gaussische populatieverdeling met een onbekend populatiegemiddelde μ en populatievariantie σ², trekken we n i.i.d. steekproeven uit de populatie, zodanig dat voor elke steekproef x_i uit een set X,

Terwijl de normale schatting van x_i μ is, is de normale schatting van x_i² meer dan μ². Dit is het resultaat van het niet-rechtstreeks in kaart brengen van de vierkante capaciteit, waarbij de vergroting van grotere getallen groter is dan die van kleinere getallen. Bijvoorbeeld, set (1,2,3,4,5) heeft een gemiddelde 3 en verschil 2. Door de kwadratuur van elke component krijgen we (1,4,9,16,25) met een gemiddelde 11=3²+2. Deze eigenschap hebben we in een later stadium nodig.

Schatters

Aangezien we geen flauw idee hebben van de echte volkseigenschappen, kunnen we ons best doen om schatters van die eigenschappen uit de voorbeeldset te karakteriseren met behulp van een vergelijkende ontwikkeling.

Wat dacht je ervan om een kapje (^) op μ en σ² te zetten en ze ‘pseudo-‘ gemiddelde en fluctuatie te noemen, en we karakteriseren het op een bijbehorende manier:

De definities zijn enigszins discretionair. U kunt ze in principe op een veel fijnere manier karakteriseren en testen, maar we moeten de meest directe proberen. We karakteriseren pseudo-middel ^μ als de normale van alle voorbeelden X. Het voelt alsof dit zo goed is als verwacht kan worden. Een verstandige waarschuwing voor het pseudo-middel dat wordt voorgesteld als een onpartijdige schattebout voor de bevolking:

Eenvoudig. Al met al is het echte voorbeeldverschil gebaseerd op het bevolkingsgemiddelde μ, dat duister is. Wij vervangen het in deze zin door pseudo-middel ^μ, zoals hierboven is verschenen, in die mate dat pseudo-verandering onderhevig is aan pseudo-middel.

1. 2. Niveau van de opportuniteit

Stel dat we een eerlijke dobbelsteen hebben, maar niemand beseft dat het redelijk is, met uitzondering van Jason. Hij realiseert zich dat het bevolkingsgemiddelde μ (3,5 pts). Arme William vraagt om de feitelijke eigendom te krijgen, maar toch wil Jason niet verhuizen. William moet schattingen maken door te testen, bijvoorbeeld door de dobbelstenen even vaak te gooien als hij kan. Hij krijgt deze show meerdere keren op de weg, en hij kreeg 1 en 3 pts in de eerste twee voorrondes.

Gezien de echte bevolking gemiddelde μ (3,5 pts), zou je zelfs nu geen idee hebben wat de derde rol was. Niettemin, op de uit kans dat je je realiseerde dat het voorbeeld gemiddelde ^μ 3,33 pts was, zou je er zeker van zijn dat de derde worp 6 was, omdat (1+3+6)/3=3,33 – snelle wiskunde.

Uiteindelijk betekent het voorbeeld dat het precies één stukje data uit de voorbeeldset belichaamt, terwijl het populaat dat niet doet. Op deze manier geeft het voorbeeldmiddel één niveau minder kans aan de voorbeeldset.

Dit is de reden dat ons meestal werd verteld, maar dit is zeker geen hartverwarmend en volledig bewijs waarom we de noemer moeten vervangen door (n-1).

2. 2. Bron van vooringenomenheid

Met behulp van een soortgelijk dobbelsteenmodel. Jason kent het echte gemiddelde μ, langs deze lijnen kan hij met behulp van het echte populatiegemiddelde (3,5 pts) de fluctuatie vaststellen en krijgt hij een echte verandering van 4,25 pts². William moet pseudo-middel ^μ (3,33 pts voor deze situatie) nemen bij het bepalen van de pseudo-fluctuatie (een veranderingsschatter die we hebben gekarakteriseerd), die 4,22 pts² is.

De waarheid wordt verteld, pseudo-verandering belichaamt consequent het echte voorbeeldverschil (behalve als het testgemiddelde overeenkomt met het populatiegemiddelde), want pseudo is de minimalisator van het pseudo-fluctuatiewerk, zoals als volgt wordt gedemonstreerd.

U kunt deze aankondiging controleren door de primaire ondergeschikte test, of door onderzoek afhankelijk van de convexiteit van de capaciteit.

Dit suggereert dat het gebruik van pseudo-middelen vooringenomenheid genereert. Dit geeft ons echter niet de waarde van bia.

Bessel’s Aanpassing

Ons enige doel is om te onderzoeken hoe eenzijdig dit verschil schatter ^μ is. We verwachten dat het pseudo-verschil een eenzijdige schatter is, omdat het weinig denkt aan echte fluctuaties zoals eerder genoemd. Door de normale schatting van ons pseudo-verschil te controleren, vinden we dat:

Langzaam en voorzichtig. De normale schatting van x_j x_k (zoals als volgt gedemonstreerd) berust op het testen van unieke (autonome) voorbeelden waar j≠k, of het equivalent (zeker ondergeschikt voor deze situatie!) test waar j=k. Aangezien we n testen hebben, is de kans op het krijgen van een soortgelijk voorbeeld 1/n. Bijgevolg,

Herinner je je de verwachte waarde van x_i² die in het begin werd vermeld? Door ^μ uit te breiden, hebben we

Vervang deze formules terug in, en we ontdekken dat de normale schatting van pseudo-fluctuatie niet de verandering van de bevolking is, maar (n-1)/n ervan. Aangezien het schalingselement voor alle beperkte positieve n minder dan 1 is, toont dit opnieuw aan dat onze pseudo-verandering weinig denkt aan de echte schommeling van de bevolking.

Om een onpartijdige schattingschatter af te stemmen, passen we gewoon de correctie van Bessel toe die de normale schatting van de schatter op één lijn brengt met het echte volksverschil.

Daar heb je het. We karakteriseren s² op een manier met als einddoel dat het een eerlijke voorbeeldwijziging is. De (n-1) noemer komt voort uit het amendement van Bessel, dat tot stand is gekomen vanwege de 1/n waarschijnlijkheid van het inspecteren van een soortgelijk voorbeeld (met substitutie) in twee rug-aan-rug preliminaries.s.

Naarmate het aantal monsters toeneemt tot oneindig n→∞ gaat de bias weg (n-1)/n→1, omdat de kans dat hetzelfde monster in twee proeven wordt bemonsterd de neiging heeft om 0 te zijn.