Een nulhypothese kan een soort hypothese zijn die gebruikt wordt in de statistiek en die voorstelt dat er geen verschil is tussen bepaalde kenmerken van een populatie (of een gegevensgenererend proces).

Een gokker kan bijvoorbeeld ook nieuwsgierig zijn of een kansspel wel eerlijk is. Als het eerlijk is, dan is de verwachte winst per spel voor beide spelers 0. Als de sport niet eerlijk is, dan zijn de verwachte verdiensten positief voor één speler en negatief voor het tegenovergestelde. om te controleren of de sport eerlijk is, verzamelt de gokker de verdiensten uit vele herhalingen van de sport, berekent de typische verdiensten uit deze gegevens en test dan de nulhypothese dat de verwachte verdiensten niet anders zijn dan nul.

Als de typische verdiensten uit de steekproefgegevens voldoende ver van nul liggen, dan zal de gokker de nulhypothese afwijzen en de keuzehypothese concluderen; namelijk dat de verwachte verdiensten per spel verschillend zijn van nul. Als de typische verdiensten uit de steekproefgegevens op het randje van nul staan, dan zal de gokker de nulhypothese niet verwerpen en in plaats daarvan concluderen dat het verschil tussen de typische verdiensten uit de info en 0 per ongeluk alleen te verklaren is.

KEY TAKEAWAYS

Een nulhypothese kan een soort gissing zijn die in de statistiek wordt gebruikt en die voorstelt dat er geen verschil is tussen bepaalde kenmerken van een populatie of een gegevensgenererend proces.

De alternatieve hypothese stelt voor dat er een verschil is.

Hypothesetests bieden een manier om een nulhypothese binnen een bepaald betrouwbaarheidsniveau af te wijzen. (Nulhypothesen kunnen echter niet worden bewezen).

Hoe een nulhypothese werkt

De nulhypothese, ook wel de gissing genoemd, gaat ervan uit dat een heel verschil tussen de gekozen kenmerken die je gewoonweg ziet tijdens een set van kennis, te danken is aan het toeval. Als bijvoorbeeld de verwachte verdiensten voor het kansspel daadwerkelijk voldoende zijn voor 0, dan is elk verschil tussen de typische verdiensten binnen de gegevens en 0 te danken aan het toeval.

Statistische hypothesen worden getoetst aan de hand van een vierstappenproces. De primaire stap is dat de analist de 2 hypothesen aangeeft, zodat er vaak maar één goed is. De volgende stap is het formuleren van een analyseplan, waarin wordt aangegeven hoe de informatie zal worden geëvalueerd. De derde stap is het opstellen van het plan en het fysiek analyseren van de monstergegevens. De vierde en laatste stap is het onderzoeken van de resultaten en het afwijzen van de nulhypothese, of het beweren dat de waargenomen verschillen toevallig alleen verklaarbaar zijn.

De analisten kijken ernaar uit om de nulhypothese te verwerpen omdat het een robuuste conclusie is. De keuzeconclusie, dat de resultaten “toevallig alleen verklaarbaar” zijn, zou ook een zwakke conclusie kunnen zijn omdat het toestaat dat er naast het toeval nog andere factoren aan het werk zijn.

De analisten verwerpen de nulhypothese om een of andere variabele(n) uit te sluiten als verklaring voor het fenomeen van belang.

Nulhypothese Voorbeeld

Een eenvoudig voorbeeld: een faculteitshoofd meldt dat studenten op haar school gemiddeld zeven op tien scoren in examens. De nulhypothese is dat het populatiegemiddelde 7,0 is. Om deze nulhypothese te controleren, registreren we cijfers van zeg 30 studenten (steekproef) uit de hele studentenpopulatie van de varsity (zeg 300) en berekenen we het gemiddelde van die steekproef. Vervolgens vergelijken we het (berekende) steekproefgemiddelde met het (geclaimde) populatiegemiddelde van zeven .0 en zijn we van plan de nulhypothese af te wijzen. (De nulhypothese dat het populatiegemiddelde 7,0 is, kan niet worden bewezen met de gegevens van de steekproef; deze kan alleen worden verworpen).

Neem een ander voorbeeld: Het jaarlijkse rendement van een specifiek open-end fonds wordt geclaimd op 8%. Stel dat een open-end fonds al 20 jaar bestaat. De nulhypothese is dat het gemiddelde rendement voor het open-end fonds 8% is. We nemen een willekeurige steekproef van het jaarrendement van het open-end fonds voor bijvoorbeeld vijf jaar (steekproef) en berekenen het steekproefgemiddelde. Vervolgens vergelijken we het (berekende) steekproefgemiddelde met het (geclaimde) populatiegemiddelde (8%) om de nulhypothese te toetsen.

Voor bovenstaande voorbeelden zijn de nulhypothesen:

Voorbeeld A: Leerlingen binnen de school scoren een gemiddelde van zeven op tien in examens.

Voorbeeld B: Het gemiddelde jaarlijkse rendement van het open-end fonds is 8% eenmaal per jaar.

Om te bepalen of de nulhypothese moet worden verworpen, wordt de nulhypothese (afgekort H0) omwille van de argumentatie verondersteld waar te zijn. Vervolgens wordt het waarschijnlijke bereik van mogelijke waarden van de berekende statistiek (bijv. de gemiddelde score op 30 studententoetsen) bepaald op basis van deze veronderstelling (bijv. het bereik van plausibele gemiddelden kan variëren van 6,2 tot 7,8 als het populatiegemiddelde 7,0 is). Als het steekproefgemiddelde vervolgens buiten dit bereik ligt, wordt de nulhypothese verworpen. Anders wordt beweerd dat het verschil “toevallig alleen verklaarbaar” is, omdat het binnen het bereik ligt dat per ongeluk alleen is vastgesteld.

Een belangrijk punt om op te merken is dat we de nulhypothese testen omdat er een component van twijfel is over de geldigheid ervan. Welke informatie dan ook tegen de genoemde nulhypothese ingaat, wordt vastgelegd in de Alternatieve Hypothese (H1). Voor de bovenstaande voorbeelden zou de keuzehypothese zijn:

Studenten scoren een gemiddelde dat niet voldoende is voor een 7.

Het gemiddelde jaarlijkse rendement van het open-end fonds is niet voldoende tot 8% per jaar.

Met andere woorden, de keuzehypothese kan een directe tegenspraak zijn met de nulhypothese.

Hypothese Testen voor Beleggingen

Als voorbeeld in verband met de financiële markten, neem dan aan dat Alice ziet dat haar beleggingsstrategie een hoger gemiddeld rendement oplevert dan alleen het kopen en houden van een aandeel. De nulhypothese stelt dat er geen verschil is tussen de 2 gemiddelde rendementen, en Alice is geneigd dit te geloven totdat ze het tegendeel bewijst. Om de nulhypothese te weerleggen, zou het nodig zijn om de statistische significantie aan te tonen, die kan worden gevonden met behulp van een soort van tests. De keuzehypothese zou stellen dat de beleggingsstrategie een hoger gemiddeld rendement heeft dan een standaard buy-and-hold strategie.

De p-waarde wordt gebruikt om de statistische significantie van de resultaten uit te werken. Een p-waarde die niet of onvoldoende is voor 0,05 geeft meestal niet aan of er bewijs is tegen de nulhypothese. Als Alice een van deze tests uitvoert, zoals een test met het traditionele model, en bewijst dat het verschil tussen haar rendementen en dus de buy-and-hold rendementen kritisch is (p-waarde is een kleiner bedrag dan of adequaat tot 0,05), dan zal ze de nulhypothese weerleggen en de keuzehypothese concluderen.