A aprendizagem de máquinas está a tornar-se cada vez mais sofisticada. Tanto que também pode ajudar na tomada de decisões. Uma árvore de decisão é essencialmente uma disposição de vários resultados associados a uma série de escolhas relacionadas umas com as outras. Organizações e indivíduos podem utilizá-la para ponderar as suas acções com base em múltiplos factores tais como benefícios, probabilidades, e custos. Pode utilizar uma árvore de decisão em pitão para mapear algoritmos para prever a escolha mais favorável ou para conduzir discussões não formais.
Os mineiros de dados utilizam esta ferramenta com bastante frequência para derivar estratégias para alcançar vários objectivos. No entanto, descobrirá que a aprendizagem de máquinas é onde a utilização de uma árvore de decisão é mais prevalecente. Tipicamente, uma árvore de decisão começa com um nó. Pode ramificar-se em numerosos resultados. Cada resultado leva a acrescentar nós que se ramificam em mais possibilidades, dando-lhe uma forma semelhante a uma árvore.
Quais são os Diferentes Nós de uma Árvore de Decisão?
Uma árvore de decisão tem três tipos de nós: nós de decisão, nós finais, e nós de probabilidade. Os nós de probabilidade representam um círculo – realça as probabilidades de um resultado particular. A forma quadrada representa o nó de decisão – indica uma escolha que se tem de fazer. Finalmente, o nó final representa o resultado de uma decisão.
Exemplo de análise de uma árvore de decisão
É possível reduzir os riscos e maximizar as hipóteses de alcançar resultados desejáveis calculando o valor previsto ou a utilidade de cada escolha na árvore. Se quiser calcular a utilidade esperada de uma escolha, subtraia o custo das decisões aos seus benefícios esperados. Os benefícios esperados são proporcionais ao valor global de cada resultado que poderia ocorrer a partir dessa opção.
Quando se tenta encontrar um resultado desejável, é essencial considerar as preferências do decisor em relação à utilidade. Por exemplo, alguns estão prontos a assumir riscos para obter benefícios consideráveis, enquanto outros querem assumir a menor quantidade de riscos.
Assim, quando utiliza a sua árvore de decisão com o seu modelo de probabilidade, pode ser útil para calcular a probabilidade condicional de um evento. Pode também ser ideal para determinar se irá acontecer com base noutros eventos. Por conseguinte, deve começar com um evento inicial uniforme e seguir o seu caminho até ao evento que está a visar. Depois, multiplique a probabilidade de cada evento em conjunto para obter os resultados.
Em casos como estes, pode utilizar uma árvore de decisão na forma de um diagrama em árvore convencional que mapeia as probabilidades de vários eventos, como por exemplo, lançar os dados duas vezes.
Compreender o Algoritmo da Árvore de Decisão
O algoritmo de uma árvore de decisão em píton pertence a um grupo de algoritmos supervisionados. Além disso, ao contrário da maioria dos algoritmos de aprendizagem supervisionados, pode-se utilizar o algoritmo de uma árvore de decisão para resolver problemas de classificação e regressão.
Mais uma vez, o principal objectivo de uma árvore de decisão para desenvolver um modelo de treino é prever o valor ou classe de um alvo através da compreensão das regras fundamentais de decisão extraídas de dados mais antigos, que os programadores também referem como dados de treino.
Comece pela raiz da árvore ao tentar prever a etiqueta da classe de um registo e compare o valor do atributo raiz com a característica do registo. Quando se trata de comparação, siga o ramo que corresponde ao seu valor, depois do qual pode ir para o outro nó.
Quantos Tipos de Árvores de Decisão existem?
Os tipos de árvores de decisão dependem de variáveis-alvo. Existem dois tipos de árvores de decisão:
- Árvore de decisão de variável contínua
- Árvore de decisão variável categórica
Por exemplo, temos de prever se alguém irá reembolsar o seu prémio de renovação através da sua companhia de seguros. O que sabemos neste cenário é que o rendimento do cliente é uma variável maciça.
No entanto, o serviço de seguros não possui todos os detalhes do seu cliente. A maioria de vós saberá que esta variável é crítica. Portanto, podemos então desenvolver uma árvore de decisão para prever o rendimento de um cliente através de outras variáveis como produtos e ocupação. Estaremos sobretudo a especular valores para variáveis contínuas.
Quais são os prós e os contras de uma árvore de decisão?
Os Pontos Fortes
- As árvores de decisão oferecem uma ideia clara dos campos críticos para a classificação ou previsão
- Uma árvore de decisão é capaz de lidar com variáveis categóricas e contínuas
- Não requerem cálculos em excesso para a realização de classificações
- Estas árvores podem gerar regras facilmente compreensíveis
As Fraquezas
- Os erros são bastante comuns em árvores de decisão, particularmente quando se trata de problemas de classificação e exemplos de formação
- As árvores de decisão não são uma opção ideal se estiver a criar tarefas de estimativa para prever o valor de um atributo contínuo
- A formação de uma árvore de decisão pode ser bastante dispendiosa em termos computacionais. É preciso ordenar o campo de cuspidos de cada candidato de cada nó para determinar a divisão mais favorável. Alguns algoritmos utilizam combinações que requerem uma pesquisa abrangente para determinar os pesos de combinação adequados.
- A poda dos algoritmos é bastante dispendiosa, principalmente porque é necessário comparar e formar as sub-árvores.
Terminologias Essenciais de Árvore de Decisão
Nodos Infantis e Parentais
Qualquer nó que se divide em sub-nós é também conhecido como nó pai. Os sub-nós, por outro lado, são os nós filhos.
Sub-árvore/Brancha
A subsecção da secção de uma árvore de decisão é a sua sub-árvore ou ramo.
Poda
A poda é o processo em que se reduz o tamanho da árvore de decisão, arrancando os seus nós.
Nó terminal/folha
Os nós Folha ou Terminal não têm filhos e não passam por fendas extra.
Nó de Decisão
Quando um único sub-nó se divide em vários nós, torna-se um nó de decisão.
Dividindo
A divisão é o processo que divide um nó em vários sub-nós.
Nó Raiz
O nó de raiz representa a amostra ou população total de cada nó. Divide-se ainda em múltiplos conjuntos homogéneos.
Pensamentos finais
O desenvolvimento de uma árvore de decisão em python pode resolver múltiplos problemas relacionados com a decisão para organizações grandes e pequenas. Pode também ajudar os indivíduos a decidir se a escolha que estão prestes a fazer seria rentável. Os desenvolvedores utilizam frequentemente a biblioteca de python para desenvolver uma árvore de decisão de python. A sua implementação e algoritmo são mais eficientes e produzem melhores resultados.