Машинное обучение становится все более сложным. Настолько, что оно может помочь и в принятии решений. Дерево решений, по сути, представляет собой схему различных результатов, связанных с рядом вариантов выбора, относящихся друг к другу. Организации и отдельные лица могут использовать его для взвешивания своих действий на основе множества факторов, таких как выгоды, вероятности и затраты. Вы можете использовать дерево решений в питоне для выстраивания алгоритмов для прогнозирования наиболее благоприятного выбора или для стимулирования неформальных дискуссий.
Добытчики данных довольно часто используют этот инструмент для получения стратегий достижения различных целей. Однако, вы обнаружите, что машинное обучение – это то место, где использование дерева решений более распространено. Как правило, дерево решений начинается с одного узла. Оно может разветвляться на множество результатов. Каждый результат приводит к добавлению узлов, которые расширяют возможности, придавая ему форму, похожую на дерево.
Каковы различные узлы дерева решений?
Дерево решений имеет три типа узлов: узлы принятия решений, конечные узлы и узлы шансов. Узлы шансов представляют собой круг – он подчеркивает вероятности конкретного результата. Квадратная форма представляет собой вершину решения – она указывает на выбор, который необходимо сделать. Наконец, конечный узел представляет собой результат решения.
Анализ Пример дерева решений
Вы можете снизить риски и максимизировать шансы на достижение желаемых результатов, рассчитав прогнозируемое значение или полезность каждого выбора на дереве. Если вы хотите вычислить ожидаемую полезность выбора, вычитайте стоимость этого решения из его ожидаемых выгод. Ожидаемые выгоды пропорциональны общей стоимости каждого результата, который может быть достигнут при использовании этого варианта.
Когда вы пытаетесь найти желаемый результат, необходимо учитывать предпочтения лица, принимающего решение, относительно полезности. Например, некоторые готовы пойти на риск, чтобы получить значительные выгоды, в то время как другие хотят пойти на наименьший риск.
Таким образом, когда Вы используете дерево решений с его вероятностной моделью, может оказаться полезным вычислить условную вероятность события. Оно также может быть идеальным для определения того, произойдет ли оно на основе других событий. Следовательно, Вы должны начать с начального чётного и следовать по его пути к событию, на которое Вы нацеливаетесь. Затем умножьте вероятность каждого события вместе, чтобы получить результат.
В подобных случаях можно использовать дерево решений в виде обычной древовидной диаграммы, которая отображает вероятности различных событий, например, дважды бросить кубик.
Понимание алгоритма дерева решений
Алгоритм дерева решений в питоне принадлежит к группе контролируемых алгоритмов. Также, в отличие от большинства контролируемых алгоритмов обучения, вы можете использовать алгоритм дерева решений для решения задач классификации и регрессии.
В очередной раз основной целью дерева решений при разработке обучающей модели является прогнозирование значения или класса цели путем понимания фундаментальных правил принятия решений, взятых из старых данных, которые программисты также называют обучающими данными.
Начните с корня дерева, когда вы пытаетесь предсказать метку класса записи и сравнить значение корневого атрибута с характеристикой записи. Когда дело доходит до сравнения, следуйте за той ветвью, которая соответствует его значению, после чего вы можете перейти к другому узлу.
Сколько видов деревьев решений?
Типы деревьев решений зависят от целевых переменных. Существует два типа деревьев решений:
- Дерево решений с непрерывными переменными
- Категорическое дерево принятия решений с переменными параметрами
Например, мы должны предсказать, сможет ли кто-нибудь выплатить премию за продление через свою страховую компанию. В этом сценарии мы знаем, что доход клиента – это огромная переменная.
Тем не менее, страховая служба не располагает всеми данными о клиенте. Большинство из вас будет знать, что эта переменная критична. Поэтому мы можем разработать дерево решений для прогнозирования дохода клиента через другие переменные, такие как продукты и род деятельности. В основном мы будем спекулировать значениями непрерывных переменных.
Каковы “плюсы” и “минусы” дерева решений?
Сильные стороны
- Деревья принятия решений дают четкое представление о критических полях для классификации или прогнозирования.
- Дерево решений способно обрабатывать категорические и непрерывные переменные.
- Они не требуют чрезмерных вычислений для выполнения классификаций.
- Эти деревья могут генерировать легко понятные правила
Слабые стороны
- Ошибки довольно часто встречаются в деревьях принятия решений, особенно когда речь идет о проблемах классификации и учебных примерах.
- Деревья решений не являются идеальным вариантом, если вы создаете задачи оценки для прогнозирования непрерывного значения атрибута
- Обучение дерева решений может быть довольно дорогостоящим с вычислительной точки зрения. Необходимо отсортировать поле слюны кандидата каждого узла, чтобы определить наиболее благоприятное разделение. Некоторые алгоритмы используют комбинации, которые требуют комплексного поиска для определения подходящих комбинаций весов.
- Обрезка алгоритмов довольно дорогостоящая, в основном потому, что необходимо сравнить и сформировать поддеревья.
Терминологии основных деревьев принятия решений
Детский и родительский узлы
Любой узел, который делится на подузлы, также известен как родительский узел. Подузлы, с другой стороны, являются дочерними узлами.
Под-дерево/отделение
Подраздел дерева решений – это его поддерево или ветвь.
Обрезка
Обрезка – это процесс, при котором вы уменьшаете размер дерева решений, отрывая его узлы.
Узел/лист терминала
Листовые или терминальные узлы не имеют детей и не проходят через дополнительные расщепления.
Узел принятия решений
Когда один подузел делится на несколько узлов, он становится узлом принятия решений.
Разделение
Разделение – это процесс, при котором один узел делится на несколько подузлов.
Корневой узел
Корневой узел представляет собой общую выборку или совокупность каждого узла. Далее он делится на несколько однородных наборов.
Заключительные Мысли
Разработка дерева решений в питоне может решить множество проблем, связанных с принятием решений, для больших и малых организаций. Она также может помочь отдельным людям решить, будет ли выбор, который они собираются сделать, выгодным. Разработчики часто используют питоновскую библиотеку для разработки дерева решений. Ее реализация и алгоритм более эффективны и дают лучшие результаты.