L’apprendimento delle macchine sta diventando sempre più sofisticato. Tanto che può aiutare anche nel processo decisionale. Un albero decisionale è essenzialmente un layout di vari risultati associati a una serie di scelte legate l’una all’altra. Le organizzazioni e gli individui possono utilizzarlo per ponderare le loro azioni sulla base di molteplici fattori come i benefici, le probabilità e i costi. Si può usare un albero decisionale in pitone per mappare gli algoritmi per prevedere la scelta più favorevole o per guidare discussioni non formali.
I data minatori utilizzano questo strumento abbastanza frequentemente per ricavare strategie per raggiungere vari obiettivi. Tuttavia, troverete che l’apprendimento automatico è dove l’uso di un albero decisionale è più prevalente. In genere, un albero decisionale inizia con un nodo. Può ramificarsi in numerosi risultati. Ogni risultato porta ad aggiungere nodi che si ramificano in più possibilità, dandogli una forma simile a quella di un albero.
Cosa sono i diversi nodi di un albero decisionale?
Un albero decisionale ha tre tipi di nodi: nodi decisionali, nodi finali e nodi casuali. I nodi casuali rappresentano un cerchio – evidenziano le probabilità di un particolare risultato. La forma quadrata rappresenta il nodo decisionale – indica una scelta che si deve fare. Infine, il nodo finale rappresenta il risultato di una decisione.
Esempio di analisi di un albero decisionale
È possibile ridurre i rischi e massimizzare le possibilità di ottenere i risultati desiderati calcolando il valore o l’utilità prevista di ogni scelta sull’albero. Se si vuole calcolare l’utilità prevista di una scelta, sottrarre il costo delle decisioni dai benefici attesi. I benefici attesi sono proporzionali al valore complessivo di ogni risultato che potrebbe derivare da quell’opzione.
Quando si cerca di trovare un risultato auspicabile, è essenziale considerare le preferenze del decisore riguardo all’utilità. Ad esempio, alcuni sono pronti ad assumersi dei rischi per ottenere benefici considerevoli, mentre altri vogliono assumersi il minor numero possibile di rischi.
Quindi, quando si utilizza l’albero decisionale con il suo modello di probabilità, può essere utile calcolare la probabilità condizionale di un evento. Potrebbe anche essere l’ideale per determinare se si verificherà sulla base di altri eventi. Pertanto, dovete iniziare con un primo pari e seguire il suo percorso verso l’evento a cui state mirando. Poi, moltiplicare la probabilità di ogni evento per ottenere i risultati.
In casi come questi, è possibile utilizzare un albero decisionale sotto forma di un diagramma ad albero convenzionale che mappi le probabilità di vari eventi, ad esempio lanciando il dado due volte.
Comprendere l’algoritmo dell’albero decisionale
L’algoritmo di un albero decisionale in pitone appartiene ad un gruppo di algoritmi supervisionati. Inoltre, a differenza della maggior parte degli algoritmi di apprendimento supervisionati, è possibile utilizzare l’algoritmo di un albero decisionale per risolvere i problemi di classificazione e di regressione.
Ancora una volta, l’obiettivo primario di un albero decisionale per sviluppare un modello di formazione è quello di prevedere il valore o la classe di un target attraverso la comprensione di regole decisionali fondamentali prese da dati più vecchi, a cui i programmatori si riferiscono anche come dati di formazione.
Iniziare dalla radice dell’albero quando si cerca di prevedere l’etichetta di classe di un record e confrontare il valore dell’attributo radice con la caratteristica del record. Quando si tratta di confrontare, seguire il ramo che corrisponde al suo valore, dopo di che si può andare all’altro nodo.
Quanti tipi di alberi decisionali ci sono?
I tipi di alberi decisionali dipendono dalle variabili target. Esistono due tipi di alberi decisionali:
- Albero decisionale a variabile continua
- Albero di decisione delle variabili categoriali
Ad esempio, dobbiamo prevedere se qualcuno rimborserà il premio di rinnovo attraverso la propria compagnia di assicurazione. Quello che sappiamo in questo scenario è che il reddito del cliente è una variabile enorme.
Tuttavia, il servizio assicurativo non possiede tutti i dettagli del cliente. La maggior parte di voi saprà che questa variabile è fondamentale. Pertanto, possiamo quindi sviluppare un albero decisionale per prevedere il reddito di un cliente attraverso altre variabili come i prodotti e l’occupazione. Per la maggior parte di noi si tratterà di valori speculativi per variabili continue.
Quali sono i pro e i contro di un albero decisionale?
I punti di forza
- Gli alberi decisionali offrono un’idea chiara dei campi critici per la classificazione o la previsione
- Un albero decisionale è in grado di gestire variabili categoriche e continue
- Non richiedono un calcolo eccessivo per l’esecuzione delle classificazioni
- Questi alberi possono generare regole facilmente comprensibili
Le debolezze
- Gli errori sono abbastanza comuni negli alberi decisionali, in particolare quando si tratta di problemi di classificazione ed esempi di formazione
- Gli alberi decisionali non sono un’opzione ideale se si creano compiti di stima per prevedere il valore di un attributo continuo
- La formazione di un albero decisionale può essere molto costosa dal punto di vista dei calcoli. Bisogna ordinare il campo di sputo del candidato di ogni nodo per determinare la suddivisione più favorevole. Alcuni algoritmi utilizzano combinazioni che richiedono una ricerca completa per determinare i pesi di combinazione adatti.
- La potatura degli algoritmi è abbastanza costosa, soprattutto perché bisogna confrontare e formare i sottoalberi.
Terminologie dell’albero decisionale essenziale
Nodi figlio e genitore
Qualsiasi nodo che si divide in sotto-nodi è anche conosciuto come nodo genitore. I sotto-nodi, invece, sono i nodi figli.
Sotto-Treo/Branco
La sottosezione della sezione di un albero decisionale è il suo sottoalbero o ramo.
Potatura
La potatura è il processo in cui si riduce la dimensione dell’albero decisionale spennandone i nodi.
Nodo terminale / Soglia
I nodi a foglia o terminali non hanno figli e non passano attraverso spaccature extra.
Nodo decisionale
Quando un singolo sotto-nodo si divide in più nodi, diventa un nodo decisionale.
Dividere
La scissione è il processo che divide un nodo in più sotto-nodi.
Nodo radice
Il nodo radice rappresenta il campione o la popolazione complessiva di ogni nodo. Si divide inoltre in più insiemi omogenei.
Pensieri finali
Lo sviluppo di un albero decisionale in pitone può risolvere molteplici problemi decisionali per organizzazioni grandi e piccole. Può anche aiutare gli individui a decidere se la scelta che stanno per fare sarebbe redditizia. Gli sviluppatori spesso utilizzano la libreria di sclearn del pitone per sviluppare un albero decisionale di sclearn. La sua implementazione e il suo algoritmo sono più efficienti e producono risultati migliori.