Beschrijving
Het is ook bekend als een spreidingsgrafiek, puntgrafiek, X-Y-grafiek, spreidingsgrafiek of spreidingsdiagram.
Scatterplots maken gebruik van een verzameling van punten die gepositioneerd zijn met behulp van cartesiaanse coördinaten om de waarden van twee variabelen weer te geven. Door het bekijken van een variabele in elke as, is het mogelijk om te detecteren of er een verband of correlatie is tussen de twee variabelen.
Verschillende soorten correlatie kunnen worden geïnterpreteerd door middel van de diagrammen die worden weergegeven op de Scatterplots. Deze zijn positief (waarden nemen samen toe), negatief (de ene waarde neemt af naarmate de andere toeneemt), nihil (geen correlatie), lineair, exponentieel en U-vormig. De correlatiesterkte kan worden bepaald door hoe dicht de punten bij elkaar liggen op de grafiek. De punten die ver buiten de algemene verzameling van punten eindigen staan bekend als uitschieters.
Rijen of krommen worden in de grafiek ingevoegd om de analyse te vergemakkelijken en worden zo dicht mogelijk bij alle punten getekend en om te laten zien hoe alle punten tot één lijn zijn gecondenseerd. De lijn is typisch bekend als de best passende lijn of een trendlijn en kan worden gebruikt om schattingen te maken door middel van interpolatie.
De scatterplots zijn ideaal wanneer je gekoppelde numerieke gegevens hebt en wilt zien of de ene variabele een impact heeft op de andere. Vergeet echter niet dat correlatie geen causaliteit is en dat een andere ongemerkte variabele de resultaten kan beïnvloeden.