Псевдокод
Программисты и специалисты по исследованию данных чаще всего используют термин псевдокод для программирования и задач машинного обучения. С помощью псевдокода программист представляет свои коды...
Очистка данных
Алгоритмы машинного обучения могут собирать, хранить и анализировать данные и выдавать ценный результат. Эти инструменты позволяют оценить состояние, используя сложные и кластеризованные данные. Можно...
Категориальное кодирование
Категориальное кодирование – это техника кодирования категориальных данных. Следует помнить, что категориальные данные – это наборы переменных, которые содержат не числовые значения, а метки....

Мультиколлинеарность
Благодаря все более совершенным алгоритмам машинного обучения и глубокого обучения можно решить практически любую проблему с помощью соответствующих наборов данных. Однако по мере увеличения...

Хи-тест
При разработке модели машинного обучения вы можете столкнуться с множеством проблем. Одна из распространенных проблем, связанных с выбором признаков, определяет, насколько релевантны входные признаки...
НЛП и здравоохранение
NLP или Natural Language Processing (Обработка естественного языка) – это технология искусственного интеллекта, которая помогает машинам понимать человеческий язык. С помощью NLP инженеры смешивают...

Понимание BERT
Недостаток данных об обучении – вероятно, самая сложная проблема, с которой сталкивается обработка естественного языка, более известная как NLP. Для тех, кто не знает,...

БД МНИСТ
база данных MNIST (Change National Organization of Benchmarks and Innovation database) представляет собой огромную базу данных, состоящую из вручную написанных цифр, которая обычно используется...
Ложное отрицание
При понимании гипотезы две ошибки могут сбить с толку. Эти две ошибки – ложноотрицательная и ложноположительная. Ложноотрицательную ошибку можно также назвать ошибкой второго типа,...

Обзор сюжета коробки
График ящиков или ящиков, а также график вискеров помогут вам отобразить распределение базы данных в виде сводки из пяти чисел. Первый квартиль Q1 будет...

Байесские сети
Создание вероятностной модели может быть сложным делом, но окажется полезным в процессе обучения на станке. Для создания такой графической модели необходимо найти вероятностные связи...

2021 г. Научные тенденции в области данных
2020 год был сложным для всех. Несмотря на то, что он был полон неожиданных событий, он позволил внедрить новые разработки в цифровой мир. Мир...
Простое объяснение концепции обратного размножения
Обратное размножение является необходимым инструментом или алгоритмом для внесения улучшений, когда вы испытываете плохие результаты от машинного обучения и интеллектуального анализа данных. Когда вы...

Введение в t-SNE
Снижение размерности Если вы раньше работали с набором данных с большим количеством ярких моментов, вы можете понять, что это так трудно понять или исследовать...
Лучшая IDE для Python
Написание кода с помощью Python Shell или IDLE не является сложной задачей. Однако использование этих инструментов для больших проектов может быть пугающим. Поэтому вам...

Оценка максимального правдоподобия
Как специалист по исследованию данных, вы должны понимать, как правильно интерпретировать механизм работы модели. Интерпретация – это важный аспект науки о данных. Каждый раз,...

Лог-лосс
В машинном обучении вы можете решать задачи предсказательного моделирования через задачи классификации. Для каждого наблюдения в модели необходимо предсказать метку класса. Входные данные будут...
Компьютерное зрение и здравоохранение
Мы предсказывали эру роботов в Виртуальном мире десятилетиями, но на протяжении десятилетий люди скептически относились к этому. Вплоть до нескольких лет они не были...
R-CNN, быстрый R-CNN, более быстрый R-CNN, YOLO – алгоритмы обнаружения объектов
R-CNN Чтобы обойти вопрос выбора бесчисленных районов, Росс Гиршик и др. предложили методику, при которой мы используем конкретную погоню за тем, чтобы отделить от...

Общие команды Git
Работа с Git’ом на линии заказа может быть ошеломляющей. Чтобы помочь в этом, мы собрали сводку нормальных Git-направлений, каковы все методы и как их...
Что такое кривая Лоренца?
Что такое кривая Лоренца? Американский экономист Макс Лоренц ввел понятие кривой Лоренца в 1905 году. Он предложил графическое представление неравенства богатства или доходов. Горизонтальная...
Токенизация
Токенизация – не новая концепция, поскольку люди часто используют ее в блокчейне. Однако концепция токена старше, чем блокчейн. Многие люди рассматривают слово токен как...

Разложение по единичному значению
Главный компонентный анализ и сингулярное стоимостное разложение являются одними из двух общих концепций линейной алгебры в машинном обучении. После сбора исходных данных можно ли...