Poisson DistributionInformation Types zijn een belangrijk idee van inzichten, die moeten worden begrepen, om effectief feitelijke schattingen toe te passen op uw informatie en op deze manier bepaalde veronderstellingen over het nauwkeurig te sluiten. Deze blogpost zal u vertrouwd maken met de verschillende soorten informatie die u moet kennen, om passend verkennend informatieonderzoek (EDA) te doen, wat een van de meest doordachte kleine onderdelen van een AI-venture is.

Hoofdstuk voor hoofdstuk lijst:

Proloog naar informatiesoorten

Alle informatie (ogenschijnlijk, ordinaal)

Numerieke informatie (discreet, consistent, tussentijds, proportioneel)

Waarom zijn de informatiesoorten belangrijk?

Feitelijke technieken

Rundown

Proloog naar Informatiesoorten

Het hebben van een fatsoenlijk begrip van de verschillende soorten informatie, ook wel schattingsschalen genoemd, is een dringende noodzaak voor het doen van Verkennend Informatie Onderzoek (EDA), omdat je bepaalde feitelijke schattingen alleen voor expliciete informatiesoorten kunt gebruiken.

Bovendien moet u weten welk type informatie u beheert om de juiste weergavetechniek te kiezen. Beschouw informatietypen als een benadering om verschillende soorten factoren te sorteren. We zullen het hebben over de fundamentele soorten factoren en kijken naar een model voor elk van deze factoren. Af en toe zullen we er naar verwijzen als schattingsschalen.

Absolute informatie

Absolute informatie spreekt tot kwaliteiten. In die zin kan het spreken tot zaken als het geslacht, de taal, enz. van het individu. Alle informatie kan ook numeriek worden gewaardeerd (Model: 1 voor vrouwelijk en 0 voor mannelijk). Merk op dat die getallen geen numerieke betekenis hebben.

Kennelijke informatie

Ogenschijnlijke achting spreekt tot discrete eenheden en wordt gebruikt om factoren te markeren, die geen kwantitatieve waarde hebben. Beschouw ze gewoon als “labels”. Merk op dat ogenschijnlijke informatie die geen organisatie heeft. Vandaar dat bij de kans dat je de vraag naar de kwaliteiten ervan zou veranderen, de betekenis niet zou veranderen. U kunt twee gevallen van ogenschijnlijke hoogtepunten zien onder:

https://miro.medium.com/max/1800/0*KUbI9s0EGs5dXznj.png

De linkercomponent die het geslacht van een persoon weergeeft, zou “dichotomisch” worden genoemd, wat een soort van schijnbare schalen is die slechts twee klassen bevat.

Gewone informatie

De ordelijke achting spreekt met discrete en gevraagde eenheden. Het gaat op deze manier om het equivalent van ogenschijnlijke informatie, maar ook hier is het eigenlijk het vragen van zaken. U kunt een model zien onder:

https://miro.medium.com/max/1114/0*JaiYvZgwhxiaAXRK.png

Merk op dat het onderscheid tussen basis- en middelbare school niet hetzelfde is als het contrast tussen middelbare school en school. Dit is de fundamentele opsluiting van ordinale informatie, de contrasten tussen de kwaliteiten zijn niet algemeen bekend. Zo worden ordinale schalen over het algemeen gebruikt om niet-numerieke hoogtepunten zoals vreugde, consumententrouw, enz. te meten.

Numerieke informatie

1. 1. Discrete informatie

We spreken over discrete informatie als de kwaliteiten ervan onmiskenbaar en geïsoleerd zijn. Als het ware: We hebben het over discrete informatie als de informatie gewoon specifieke kwaliteiten kan aannemen. Dit soort informatie kan niet worden ingeschat, maar wordt meestal wel gecontroleerd. Het gaat in principe om gegevens die op volgorde kunnen worden gerangschikt. Een model is het aantal koppen in 100 muntstukken.

U kunt door middel van de bijgevoegde twee vragen controleren of u de discrete informatie al dan niet beheert: Zou u het kunnen tellen en zou het kunnen worden opgesplitst in kleinere en lichtere delen?

2. 2. Aanhoudende informatie

Persistente informatie spreekt tot schattingen en op deze manier kunnen de kwaliteiten ervan niet worden geaccentueerd, hoezeer ze ook kunnen worden ingeschat. Een model zou de gestalte van een individu zijn, die je kunt weergeven door gebruik te maken van interims op de echte getallenlijn.

Tussentijdse informatie

Tussentijdse hoogwaardigheidsbekleders spreken met gevraagde eenheden die een gelijkaardig onderscheid hebben. Vervolgens bespreken we tussentijdse informatie wanneer we een variabele hebben die numerieke kwaliteiten bevat die gevraagd worden en waarbij we de definitieve contrasten tussen de kwaliteiten kennen. Een model zou een element zijn dat de temperatuur van een bepaalde plek bevat zoals je hieronder kunt zien:

https://miro.medium.com/max/1786/0*HfJxbqNmzoe2L05_.png

Het probleem met interim-kwaliteitsinformatie is dat ze geen “echte nul” hebben. Dat betekent voor ons model, dat er niets van dien aard is als geen temperatuur. Met tussentijdse informatie kunnen we echter geen proporties dupliceren, isoleren of vaststellen. Omdat er geen duidelijke nul is, kunnen veel verhelderende en inferentiële inzichten niet worden toegepast.

Proportionele informatie

Verhoudingsgewijs worden bovendien eenheden gevraagd die een vergelijkbaar onderscheid hebben. Proportion esteems zijn gelijkwaardig aan interim-kwaliteiten, met het onderscheid dat ze wel degelijk een volstrekt nulpunt hebben. Echte modellen zijn bijvoorbeeld lengte, gewicht, lengte, enz.

https://miro.medium.com/max/1640/0*148a5xL5-Hr-g4ip.png

Waarom zijn de informatiesoorten belangrijk?

Datatypes zijn een significant idee in het licht van het feit dat meetbare strategieën moeten worden gebruikt met specifieke informatiesoorten. Je moet hardnekkige informatie op een unieke manier afbreken, in tegenstelling tot recht-toe-recht-aan informatie, anders zou het een off-base onderzoek opleveren. Als u weet wat voor soort informatie u beheert, bent u in staat om de juiste strategie voor onderzoek te kiezen.

Op dit moment zullen we elk type datum nog eens overlopen met betrekking tot welke meetbare strategieën kunnen worden toegepast. Om goed te kunnen zien waar we het op dit moment over hebben, moet u de basisprincipes van verhelderende inzichten begrijpen.

Feitelijke technieken

Informatie over de schijnbaarheid

Op het moment dat u de schijnbare informatie beheert, verzamelt u gegevens door middel van:

Frequenties: Herhaling is de snelheid waarmee iets gebeurt over een bepaalde periode of binnen een dataset.

Omvang: U kunt zonder veel van een stretch-cijfer de mate door het verdelen van de herhaling door de alle outnumber of gelegenheden. (bijv. hoe regelmatig iets gebeurt is geïsoleerd door hoe vaak het kan voorkomen)

Beoordeel.

Perceptiestrategieën: Om u voor te stellen dat u ogenschijnlijke informatie kunt gebruiken, kunt u gebruik maken van een taartdiagram of een staafdiagram.

https://miro.medium.com/max/1800/0*4mLeITXXwOQnSD9g.png

In Information Science kun je gebruik maken van one-hot codering, om schijnbare informatie te veranderen in een numerieke component.

Gewone informatie

Op het moment dat u ordinale informatie beheert, kunt u gebruik maken van soortgelijke strategieën zoals bij schijnbare informatie, maar u benadert ook enkele extra apparaten. Op deze manier kunt u uw ordinale informatie overbruggen met frequenties, extents, tarieven. Ook kunt u het zich voorstellen met taart- en staafdiagrammen. Ook kun je gebruik maken van percentielen, het midden, de modus en het interkwartielbereik om je informatie te condenseren.

In de informatiekunde kun je één naamcodering gebruiken, om ordinale informatie te veranderen in een numerieke component.

Constante informatie

Op het moment dat u constante informatie beheert, kunt u de meeste strategieën gebruiken om uw informatie af te beelden. U kunt uw informatie condenseren door gebruik te maken van percentielen, midden, interkwartiel go, gemiddelde, modus, standaardafwijking en bereik.

Representatiestrategieën:

Om consistente informatie af te beelden kunt u gebruik maken van een histogram of een krattenplot. Met een histogram kunt u de brandpuntshoek, de veranderlijkheid, de methodologie en de kurtosis van een transport controleren. Merk op dat een histogram u niet kan laten zien hoe groot de kans is dat u afwijkingen heeft. Dit is de reden dat we ook box-plots gebruiken.