Correlatie is een feitelijk systeem dat kan laten zien of en hoe ondubbelzinnig overeenkomsten van factoren met elkaar in verband staan. Zo zijn bijvoorbeeld de talenten en het gewicht met elkaar verbonden; langere individuen zullen over het algemeen zwaarder zijn dan kortere individuen. De relatie is niet vlekkeloos. Individuen van een vergelijkbaar kaliber fluctueren in gewicht, en je kunt zonder veel moeite twee individuen overwegen waarvan je weet waar de kortere zwaarder is dan de langere. Ongeacht, de normale belasting van individuen 5’5” is niet precies de normale belasting van individuen 5’6”, en hun normale gewicht is niet zo veel als dat van individuen 5’7”, enzovoort. Correlatie kan u vertellen hoeveel van de variatie in de gewichten van mensen gerelateerd zijn aan hun hoogte.

Ondanks het feit dat deze relatie echt duidelijk is, kan uw informatie onvermoede verbanden bevatten. U kunt ook speculeren dat er connecties zijn, maar realiseert u zich niet welke het meest gegrond zijn. Een inzichtelijk relatieonderzoek kan leiden tot een beter begrip van uw informatie.

Systemen in het bepalen van de correlatie

Er zijn een paar verschillende verbindingsstrategieën. De discretionaire statistische module van het enquêtesysteem bevat de meest bekende soort, genaamd de Pearson of item-minute relatie. De module bevat ook een kleine afwijking van deze soort, die halverwege de verbinding wordt genoemd. Dit laatste is nuttig wanneer u de verbinding tussen twee factoren moet bekijken terwijl u de impact van een paar verschillende factoren moet verdrijven.

Zoals elke feitelijke procedure is de verbinding geschikt voor bepaalde soorten informatie. Relatie werkt voor kwantificeerbare informatie waarin getallen belangrijk zijn, over het algemeen bedragen of enige gelijkenis daarvan. Het kan niet gebruikt worden voor simpele informatie, bijvoorbeeld geslacht, gekochte merken of meest geliefde arceringen.

Beoordelingsschalen

Beoordelingsschalen zijn een twijfelachtig middelpuntgeval. De getallen in beoordelingsschalen hebben betekenis, maar dat belang is niet uitzonderlijk precies. Ze houden niet van bedragen. Met een bedrag, (bijvoorbeeld dollars), is het contrast ergens in het bereik van 1 en 2 eigenlijk gelijk aan ergens in het bereik van 2 en 3. Met een waarderingsschaal is dat over het algemeen niet het geval. U kunt er zeker van zijn dat uw respondenten denken dat een waardering van 2 tussen een waardering van 1 en een waardering van 3 ligt, maar u kunt er niet zeker van zijn dat ze denken dat het daadwerkelijk ergens tussen ligt. Dit geldt met name voor de kans dat u het midden van uw schaal een naam geeft (u kunt niet verwachten dat “groot” eigenlijk ergens tussen “prachtig” en “redelijk” in ligt).

De meeste analisten stellen dat je geen gebruik kunt maken van relaties met beoordelingsschalen, omdat de wetenschap van het systeem accepteert dat de contrasten tussen de getallen eigenlijk gelijkwaardig zijn. In ieder geval maken veel studie-analisten wel gebruik van verbanden met beoordelingsschalen, in het licht van het feit dat de uitkomsten doorgaans een afspiegeling zijn van deze huidige realiteit. Ons eigen standpunt is dat je verbanden met beoordelingsschalen kunt gebruiken, maar dat je dat als zodanig voorzichtig moet doen. Bij het werken met bedragen geven verbindingen exacte schattingen. Bij het werken met waarderingsschalen geven verbindingen algemene aanwijzingen.

Aansluitingscoëfficient

Het fundamentele gevolg van een relatie staat bekend als de aansluitingscoëfficiënt (of “r”). Het varieert van – 1,0 tot +1,0. Hoe dichter r bij +1 of – 1 ligt, hoe intiemer de twee factoren met elkaar verbonden zijn.

De kans dat r in de buurt van 0 komt, betekent dat er geen verband is tussen de factoren. Bij de uitkans dat r zeker is, betekent dit dat naarmate een variabele groter wordt, de verschillende variabelen groter worden. De kans dat r negatief is houdt in dat als een variabele groter wordt, de andere kleiner wordt (regelmatig een “achterwaartse” relatie genoemd).

Terwijl de verbindingscoëfficiënten regelmatig als r = (een stimulans tussen – 1 en +1) worden gedetailleerd, maakt de kwadratuur ze dan duidelijker. Het kwadraat van de coëfficiënt (of r kwadraat) is gelijk aan het percentage van het ras in de ene variabele dat wordt geïdentificeerd met het ras in de andere. Bij het berekenen van r wordt geen rekening gehouden met het decimaalteken. Een r van .5 betekent dat 25% van het ras verbonden is (.5 kwadraat =.25). Een r-schatting van .7 impliceert dat 49% van het verschil verbonden is (.7 kwadraat = .49).

Een verbindingsrapport kan ook de tweede consequentie van elke test laten zien – feitelijke centraliteit. Voor deze situatie zal het centraliteitsniveau aan u onthullen hoe waarschijnlijk het is dat de onthulde verbindingen als een toevallige inspectiefout kunnen zijn. Als de kans groot is dat u met kleine voorbeeldgroottes werkt, kies dan een rapportgroep die het opmerkelijke niveau bevat. Deze organisatie rapporteert ook de voorbeeldgrootte.

Een belangrijk ding om te onthouden bij het werken met verbindingen is om nooit een relatie te accepteren die inhoudt dat een aanpassing in de ene variabele een aanpassing in de andere veroorzaakt. Aanbiedingen van PC’s en sportschoenen zijn beide nadrukkelijk gestegen door de jaren heen en er is een hoge verbinding tussen hen, maar je kunt niet accepteren dat de aankoop van PC’s maakt individuen kopen sportschoenen (of andersom).

Voorwaarde is wel dat de Pearson-verbindingsprocedure het beste werkt met rechte verbindingen: als een variabele groter wordt, worden verschillende variabelen direct groter (of minder groot). Het werkt niet bewonderenswaardig met kromlijnige verbindingen (waarbij de relatie geen rechte lijn nastreeft). Een geval van een kromlijnige relatie is leeftijd en menselijke diensten. Ze zijn verbonden, maar de relatie streeft geen rechte lijn na. Zowel kleine jongeren als meer doorgewinterde individuen zullen over het algemeen aanzienlijk meer gebruik maken van menselijke diensten dan adolescenten of jonge volwassenen. Verschillende terugvallen (die bovendien zijn opgenomen in de Statistiekmodule) kunnen worden gebruikt om kromlijnige verbindingen te analyseren, maar het is voorbij de omvang van dit artikel.