Universeel bruikbaar

De term clusteranalyse (voor het eerst gebruikt door Tryon, 1939) omvat verschillende berekeningen en technieken voor het verzamelen van objecten van een vergelijkend soort in bepaalde classificaties. Een algemene vraag die analisten in tal van regio’s van aanvraag stellen is de manier waarop de bewaakte informatie in significante structuren kan worden gerangschikt, dat wil zeggen dat er wetenschappelijke classificaties kunnen worden gemaakt. Aan het eind van de dag is bosonderzoek een verkennend informatieonderzoek apparaat dat zich richt op het ordenen van verschillende artikelen in bossen, zodat het niveau van de relatie tussen twee items maximaal is in het geval dat ze een plaats hebben met een vergelijkbare verzameling en verwaarloosbaar in het algemeen. Gezien het bovenstaande kan groepsonderzoek worden gebruikt om structuren in informatie te vinden zonder een verduidelijking/begrijpelijkheid te geven. Uiteindelijk vindt het groepsonderzoek in principe structuren in de informatie zonder dat er duidelijkheid wordt verschaft over het bestaan ervan.

Het lukt ons vrijwel elke dag weer om ons te groeperen. Zo kan bijvoorbeeld een bijeenkomst van hamburgergezelschappen met een vergelijkbare tafel in een café worden gezien als een groepje individuen. In voedingswinkels worden bijvoorbeeld verschillende soorten vlees of groenten getoond in het equivalent of in de buurt. Er is een onberekenbaar aantal modellen waarin de groepering een belangrijke taak op zich neemt. Zo moet de onderzoeker bijvoorbeeld de verschillende soorten wezens ordenen voordat er een significante weergave van de contrasten tussen de wezens denkbaar is. Volgens het moderne systeem in de biologie behoort de mens tot de primaten, de zoogdieren, de amnioten, de gewervelde dieren en de dieren. Merk op hoe in deze opstelling, hoe hoger de graad van het totaal, hoe minder vergelijkend de individuen in de afzonderlijke klasse zijn. De mens heeft meer gemeen met alle andere primaten (bijv. apen) dan met de meer “verre” leden van de zoogdieren (bijv. honden), enz. Voor een overzicht van de algemene klassen van groepsonderzoeksstrategieën, zie Joining (Tree Bunching), Two-way Joining (Square Grouping), en k-Means Bunching. Om het duidelijk te stellen, wat het idee van uw bedrijf ook is, ooit zult u tegen een groeperingsprobleem van een of andere structuur aanlopen.

Feitelijke hugenessetests

Merk op dat de bovenstaande uitwisselingen verwijzen naar groepsberekeningen en niet verwijzen naar iets dat betrekking heeft op het testen van de feitelijke wezenlijkheid. De waarheid wordt verteld, is het groepsonderzoek niet zo veel van een gewone meetbare test aangezien het een ,,inzameling” van diverse berekeningen is die ,,voorwerpen in bossen zoals per rondom gekarakteriseerde gelijkenis de show” in werking stelt. Het punt hier is dat niet normaal voor sommige andere feitelijke systemen, bosonderzoek strategieën voor het grootste deel worden gebruikt wanneer we geen van de eerdere speculaties hebben, maar nog steeds in de verkennende periode van ons onderzoek zitten. Als het ware, bosonderzoek vindt de “meest kritische regeling denkbaar.” Dus, meetbare essentialiteitstesten zijn hier echt niet geschikt, zelfs niet in situaties waarin p-niveaus worden verantwoord (zoals in k-implicies groepering).

Aansluiting (Boomgroepering)

Diversen geëgaliseerde boom

Scheidingsmaatregelen

Samenvoeging of aaneenschakelingsregels

ALGEMENE Redenen

Het model in de Universeel bruikbare Presentatie toont het doel van de berekening van de verbinding of de boomgroepering. De reden voor deze berekening is het consolideren van objecten (bijv. wezens) in progressief grotere bossen, waarbij een zekere mate van nabijheid of scheiding wordt gebruikt. Een van de gevolgen van een dergelijke groepering is de verschillende niveaus van de boom.

Divers genivelleerde BOOM

Beschouw een Evenwichtige Gelijkvloerse Boomplot (zie diagram hieronder), links van het perceel, beginnen we met elk item in een klasse die onafhankelijk is van iemand anders. Stel je voor dat we, in kleine stappen, onze basis “afwikkelen” met betrekking tot wat er wel en niet een van een soort is. Anders gezegd, we brengen onze rand naar beneden met betrekking tot de keuze wanneer we ten minste twee items te verkondigen als individuen uit een vergelijkbare groep.

Zo verbinden we een steeds groter aantal items met elkaar en maken we steeds grotere groepen van progressief verschillende componenten (samenvoegen). Eindelijk, in de laatste aanloop, worden alle artikelen samengevoegd. In deze plots betekent de gelijkmatige spil de aaneenschakelingsscheiding (in Vertical Icicle Plots geeft de verticale spil de aaneenschakelingsscheiding aan). Op deze manier kunnen we voor elke hub in het diagram (waar een andere tros wordt gevormd) de standaard scheiding bekijken waarbij de betreffende componenten met elkaar zijn verbonden tot een andere groep. Op het moment dat de informatie een onmiskenbare “structuur” bevat voor zover het gaat om groepen van artikelen die op elkaar lijken, zal deze structuur op dat moment regelmatig als bepaalde takken terug te vinden zijn in de verschillende niveaus van de boom. Als nawerking van een effectief onderzoek met de verbindingstechniek kunnen we bossen (takken) onderscheiden en die takken vertalen.

ScheidingsMAATREGELEN

De verbindingstechniek of boombundeltechniek maakt gebruik van de verschillen (gelijkenissen) of scheidingen tussen objecten bij het vormgeven van de groepen. Similitudes zijn een heleboel beslissingen die invullen als criteria voor het verzamelen of isoleren van dingen. In het vroegere model was de standaard voor het verzamelen van verschillende avondmaaltijden of ze een gelijkaardige tafel hadden of niet. Deze scheidingen (gelijkenissen) kunnen worden gebaseerd op een solitaire meting of verschillende metingen, waarbij elke meting spreekt over een standaard of conditie voor het verzamelen van objecten. Als we bijvoorbeeld op de een of andere manier snelle voedselinname zouden hebben, zouden we rekening kunnen houden met het aantal calorieën dat ze bevatten, hun waarde, emotionele beoordelingen van de smaak, enzovoort. De duidelijkste methode voor het verwerken van scheidingen tussen objecten in een multidimensionale ruimte is het registreren van Euclidische scheidingen. In het geval dat we een paar dimensionale ruimtes hadden is deze maat de echte geometrische scheiding tussen objecten in de ruimte (d.w.z., alsof ze met een liniaal worden geschat). In elk geval, de verbindingsberekening “geeft het geen tweede gedachte” ongeacht of de scheidingen die er “gevoed” worden echte scheidingen zijn of een ander bepaald deel van de scheiding dat steeds belangrijker wordt voor de analist; en het is afhankelijk van de specialist om de juiste strategie te kiezen voor zijn/haar specifieke toepassing.

Euclidische scheiding. Dit is waarschijnlijk de meest voorkomende vorm van scheiding. Het is gewoon de geometrische scheiding in de multidimensionale ruimte. Het wordt verwerkt als:

afstand(x,y) = {ttp://www.statsoft.com/textbook/graphics/sigmablu.gifi (xi – yi)2 }½

Merk op dat Euclidische (en vierkante Euclidische) scheidingen typisch worden verwerkt uit ruwe informatie, en niet uit geïnstitutionaliseerde informatie. Deze techniek heeft bepaalde aandachtspunten (bijvoorbeeld, de scheiding tussen twee items wordt niet beïnvloed door de uitbreiding van nieuwe artikelen naar het onderzoek, wat een uitzondering kan zijn). Hoe dan ook, de scheidingen kunnen significant worden beïnvloed door schaalcontrasten tussen de metingen waarvan de scheidingen worden geregistreerd. Als bijvoorbeeld één van de metingen een bewuste lengte in centimeters betekent, en je zet die om in millimeters (door de kwaliteiten met 10 te vermenigvuldigen), dan kunnen de daaropvolgende Euclidische of kwadratische scheidingen (afkomstig van verschillende metingen) ongelooflijk beïnvloed worden (d.w.z. eenzijdig door die metingen die een grotere schaal hebben), en dus kunnen de gevolgen van bosonderzoek totaal verschillend zijn. Voor het grootste deel is het een goede gewoonte om de metingen te veranderen zodat ze een vergelijkbare schaal hebben.

Vierkante Euclidische scheiding. Het kan nodig zijn om de standaard Euclidische scheiding in het kwadraat te plaatsen om zo een logischerwijze meer opmerkelijke belasting te plaatsen op objecten die verder gescheiden zijn. Deze scheiding wordt geregistreerd als (zie ook de opmerking in de vorige passage):

Stadsplein (Manhattan) scheiding. Deze scheiding is in wezen het normale contrast over de metingen heen. Een groot deel van de tijd levert deze scheidingsmaatstaf resultaten op zoals de eenvoudige Euclidische scheiding. Merk echter op dat in deze maatregel de impact van enkele grote contrasten (anomalieën) wordt opgevangen (omdat ze niet in het kwadraat zijn). De stad-kwadraat scheiding wordt als volgt berekend:

afstand(x,y) = I |xi – yi|

Chebychev scheiding. Deze scheidingsmaatstaf kan geschikt zijn in situaties waarin we twee artikelen als “divers” moeten karakteriseren in het geval dat ze op een van de metingen divers zijn. De Chebychev-scheiding wordt weergegeven als:

afstand(x,y) = maximum|xi – yi|

Stroomscheiding. Zo nu en dan moeten we misschien het dynamische gewicht dat op metingen wordt gezet, waarop de afzonderlijke artikelen totaal verschillend zijn, verhogen of verlagen. Dit kan worden gecultiveerd door middel van vermogensscheiding. De vermogensscheiding wordt als volgt berekend:

afstand(x,y) = (I |xi – yi|p)1/r

waarbij r en p als cliënt gekarakteriseerde parameters gelden. Een paar modelberekeningen kunnen laten zien hoe deze maatregel “doorgaat”. Parameter p regelt het dynamische gewicht dat op contrasten op individuele metingen wordt gezet, parameter r regelt het dynamische gewicht dat op grotere contrasten tussen objecten wordt gezet. In het geval dat r en p gelijk zijn aan 2, is deze scheiding op dat moment gelijk aan de Euclidische scheiding.

Procentueel verschil. Deze maatregel is vooral waardevol als de informatie voor de metingen die in het onderzoek zijn opgenomen, ongemotiveerd van aard is. Deze scheiding wordt als volgt berekend:

afstand (x,y) = (aantal xi yi)/I