Machinaal leren wordt steeds geavanceerder. Zozeer zelfs dat het ook kan helpen bij het nemen van beslissingen. Een beslisboom is in wezen een indeling van verschillende uitkomsten die samenhangen met een reeks keuzes die aan elkaar gerelateerd zijn. Organisaties en individuen kunnen het gebruiken om hun acties te wegen op basis van meerdere factoren zoals voordelen, kansen en kosten. U kunt een beslisboom in python gebruiken voor het in kaart brengen van algoritmen om de meest gunstige keuze te voorspellen of om niet-formele discussies te sturen.

Datamijnwerkers gebruiken deze tool vrij vaak om strategieën af te leiden voor het bereiken van verschillende doelen. U zult echter merken dat het gebruik van een beslisboom meer voorkomt in het machinaal leren. Meestal begint een beslisboom met één knooppunt. Het kan zich vertakken in talrijke resultaten. Elk resultaat leidt tot extra knooppunten die zich vertakken naar meer mogelijkheden, waardoor het een vorm krijgt die lijkt op een boom.

Wat zijn de verschillende knooppunten van een beslisboom?

Een beslissingsboom heeft drie soorten knooppunten: beslissingsknooppunten, eindknooppunten en toevallige knooppunten. Kansknooppunten vertegenwoordigen een cirkel – het benadrukt de waarschijnlijkheid van een bepaald resultaat. De vierkante vorm vertegenwoordigt het beslissingsknooppunt – het geeft een keuze aan die u moet maken. Tenslotte vertegenwoordigt het eindknooppunt het resultaat van een beslissing.

Related image

Analyse Voorbeeld van een beslissingsboom

U kunt de risico’s verminderen en de kans op het bereiken van gewenste resultaten maximaliseren door de voorspelde waarde of het nut van elke keuze in de boom te berekenen. Als u het verwachte nut van een keuze wilt berekenen, trek dat dan af van de verwachte voordelen. De verwachte voordelen zijn evenredig met de totale waarde van elke uitkomst die uit die optie zou kunnen voortvloeien.

Wanneer u probeert een gewenst resultaat te vinden, is het essentieel om rekening te houden met de voorkeuren van de besluitvormer met betrekking tot het nut. Sommige zijn bijvoorbeeld bereid om risico’s te nemen om aanzienlijke voordelen te behalen, terwijl anderen het minste risico willen nemen.

Dus, wanneer u uw beslissingsboom met zijn waarschijnlijkheidsmodel gebruikt, kan het handig zijn om de voorwaardelijke waarschijnlijkheid van een gebeurtenis te berekenen. Het kan ook ideaal zijn om te bepalen of het zal gebeuren op basis van andere gebeurtenissen. Daarom moet u beginnen met een eerste even en zijn pad volgen naar de gebeurtenis waarop u zich richt. Vermenigvuldig vervolgens de waarschijnlijkheid van elke gebeurtenis samen om de resultaten te verkrijgen.

In dit soort gevallen kunt u een beslissingsboom gebruiken in de vorm van een conventioneel boomdiagram dat de waarschijnlijkheid van verschillende gebeurtenissen in kaart brengt, zoals het tweemaal gooien van de dobbelstenen.

Inzicht in het beslissingsboomalgoritme

Het algoritme van een beslisboom in python behoort tot een groep van bewaakte algoritmen. Ook kunt u, in tegenstelling tot de meeste bewaakte leeralgoritmen, het algoritme van een beslisboom gebruiken om classificatie- en regressieproblemen op te lossen.

Nogmaals, het primaire doel van een beslisboom om een trainingsmodel te ontwikkelen is het voorspellen van de waarde of klasse van een doelwit door het begrijpen van fundamentele beslisregels die zijn gebaseerd op oudere gegevens, die programmeurs ook wel trainingsgegevens noemen.

Begin met de wortel van de boom wanneer u het klassenlabel van een record probeert te voorspellen en vergelijk de waarde van de wortelattribuut met het kenmerk van het record. Als het gaat om de vergelijking, volg dan de tak die overeenkomt met de waarde ervan, waarna u naar het andere knooppunt kunt gaan.

Hoeveel soorten beslissingsbomen zijn er?

Beslissingsboomtypen zijn afhankelijk van de doelvariabelen. Er zijn twee soorten beslisbomen:

  • Doorlopende Variabele Beslissingsboom
  • Categoriale variabele beslissingsboom

We moeten bijvoorbeeld voorspellen of iemand zijn verlengingspremie zal terugbetalen via zijn verzekeringsmaatschappij. Wat we in dit scenario weten is dat het inkomen van de klant een enorme variabele is.

De verzekeringsdienst beschikt echter niet over alle gegevens van de klant. De meesten van u weten dat deze variabele van cruciaal belang is. Daarom kunnen we dan een beslisboom ontwikkelen voor het voorspellen van het inkomen van een klant via andere variabelen zoals producten en beroep. We zullen vooral speculeren over waarden voor continue variabelen.

Wat zijn de voor- en nadelen van een beslisboom?

De sterke punten

  • Beslissingsbomen bieden een duidelijk beeld van de kritische velden voor classificatie of voorspelling
  • Een beslissingsboom is in staat om met categorische en continue variabelen om te gaan.
  • Voor het uitvoeren van classificaties is geen overdaad aan berekeningen nodig.
  • Deze bomen kunnen gemakkelijk te begrijpen regels genereren

De zwakke punten

  • Fouten komen vrij vaak voor in beslisbomen, vooral als het gaat om classificatieproblemen en trainingsvoorbeelden.
  • Beslissingsbomen zijn geen ideale optie als u schattingstaken maakt voor het voorspellen van de waarde van een continu attribuut.
  • Het trainen van een beslisboom kan behoorlijk rekentechnisch kostbaar zijn. U moet het spuugveld van de kandidaat van elke knoop sorteren om de meest gunstige splitsing te bepalen. Sommige algoritmen maken gebruik van combinaties die een uitgebreide zoekactie vereisen om geschikte combinaties van gewichten te bepalen.
  • Het snoeien van de algoritmen is vrij kostbaar, vooral omdat u de sub-bomen moet vergelijken en vormen.

Essentiële beslissingsboom-terminologieën

Kind en ouderknooppunten

Elk knooppunt dat zich verdeelt naar sub-nodes wordt ook wel een moederknooppunt genoemd. Subknooppunten daarentegen zijn de kinderknooppunten.

Sub-rubriek/rubriek

De doorsnede van een beslisboom is de subboom of de tak.

Snoeien

Snoeien is het proces waarbij je de beslissingsboom verkleint door de knopen weg te plukken.

Knoop/blad

Blad- of terminalknooppunten hebben geen kinderen en gaan niet door extra splitsingen heen.

Beslissingsknooppunt

Wanneer een enkel subknooppunt zich in meerdere knooppunten verdeelt, wordt het een beslissingsknooppunt.

Opsplitsing

Splitsen is het proces dat één knoop in meerdere subknopen verdeelt.

Wortelknooppunt

Het wortelknooppunt vertegenwoordigt de totale steekproef of populatie van elk knooppunt. Het verdeelt zich verder in meerdere homogene sets.

Laatste gedachten

Het ontwikkelen van een beslisboom in python kan meerdere beslisproblemen oplossen voor grote en kleinere organisaties. Het kan ook individuen helpen om te beslissen of de keuze die ze gaan maken winstgevend is. Ontwikkelaars maken vaak gebruik van de sclearn-bibliotheek van python om een sclearn-beslissingsboom te ontwikkelen. De implementatie en het algoritme zijn efficiënter en leveren betere resultaten op.