Алгоритмы
Алгоритмы машинного обучения в рекомендательных системах, как правило, делятся на две категории – методы просеивания, основанные на содержании, и методы просеивания, ориентированные на сообщества, хотя современные рекомендатели объединяют эти две методики. Совокупность стратегий контента основана на уважении сходства качеств вещей, а коммуникационно-ориентированные методы – на близости от коммуникаций. В основном речь идет об общинных стратегиях, позволяющих клиентам находить новое содержание, но совсем не о том, что было раньше.
Коммуникационно-ориентированные стратегии работают с коммуникационной сетью, которую также можно назвать рейтинговой сеткой в необычной ситуации, когда клиенты дают экспресс-оценку вещей. Задача ИИ заключается в том, чтобы получить квалификацию, которая предсказывает полезность вещей для каждого клиента
Матрица обычно огромна, исключительно скудна и большая часть качеств отсутствует.
Самое простое вычисление – это косинус или связь, сравнимость линий (клиентов) или сечений (вещей) и предписывает вещи, которые k – близкие соседи оценили
Стратегии, основанные на сетевой факторизации, стремятся к уменьшению размерности решетки ассоциации и ее неточности, по крайней мере, двумя небольшими каркасами с k неактивными сегментами
Увеличивая сравнительную линию и сегмент, вы предугадываете рейтинг вещи клиентом. Ошибка при подготовке может быть получена путем сопоставления недействительных оценок с ожидаемыми оценками. Также можно упорядочить подготовку промаха, включив в нее штрафной срок, удерживая оценки инертных векторов на низком уровне.
Наиболее популярным алгоритмом обучения является стохастический градиентный спуск, минимизирующий потери при градиентном обновлении обеих колонок и рядов матриц p a q.
В качестве альтернативы можно использовать метод наименьших квадратов, который итеративно оптимизирует матрицу p и матрицу q по шагу наименьших квадратов.
Для предложения также могут использоваться правила примирения. Вещи, которые часто поглощаются вместе, ассоциируются с краем на диаграмме. Вы можете видеть пучки блокбастеров (толсто связанные вещи, с которыми связаны почти все) и небольшие изолированные группы специализированного контента.
Правила, разработанные в сети сотрудничества, должны обладать, вероятно, незначительной помощью и уверенностью. Поддержка идентифицируется с повторением события – последствия аварийных хитов имеют высокую помощь. Высокая уверенность подразумевает, что правила не игнорируются регулярно.
Правила добычи не совсем универсальны. Расчет АПРИОРИ исследует пространство состояний мыслимых непрерывных наборов предметов и распоряжается частями пространства опроса, которое не посещается
Частые наборы элементов используются для создания правил, и эти правила генерируют рекомендации.
Например, мы показываем правила, вытекающие из работы банковских бирж в Чешской Республике. Центры (кооперации) – это терминалы, а края – это визитные биржи. Вы можете предложить банковские терминалы, которые в значительной степени зависят от прошлых выводов/инсталляций.
Наказание превалирующих вещей и разделение правил длинного хвоста с более низкими подсказками поддержки увлекательно решает, что расширить предложения и помочь найти новое содержание
Рейтинговая матрица также может быть упакована нейронной системой. Предполагаемый автокодировщик по сути такой же, как и каркасная факторизация. Глубокие автокодировщики, с различными скрытыми слоями и нелинейностями, тем более доминируют, как бы трудно их ни было подготовить. Нейронная сеть также может быть использована для препроцессирования вещей, так что мы можем консолидировать контент и сообщество приближается.
В углубленном обучении, ориентированном на сообщества, вы тренируете факторизацию сетки, в то время как с автокодировщиком консолидируются черты вещей. Очевидно, что существует гораздо больше вычислений, которые вы можете использовать для внушения, и следующая часть введения представляет несколько стратегий, зависящих от глубокого и поддерживающего обучения
Рекомендации могут оцениваться соответственно как традиционные модели искусственного осеменения на основе хронической информации (разрозненная оценка)
Взаимодействие случайно выбранных пользователей тестирования подвергается перекрестной проверке для оценки работы рекомендателя по невидимым рейтингам
Квадратный просчет корневого среднего значения (ПСПЧ) по-прежнему широко используется, несмотря на многочисленные обследования, свидетельствующие о том, что ПСПЧ является плохой оценкой онлайнового исполнения
Все более жизнеспособной разрозненной оценочной мерой является обзор или точность оценки уровня точно прописанных вещей (из предложенных или важных вещей). DCG дополнительно думает о позиции, ожидая, что уместность вещей логарифмически уменьшается.
Можно использовать дополнительные меры, которые не настолько трогательны для наклона в отключенной информации. Включение списка вместе с обзором или точностью может быть использовано для многоцелевого улучшения. Мы ознакомились с параметрами регуляризации всех вычислений, позволяющими контролировать их универсальность и наказывать за предложение выдающихся вещей.
Следует расширить как обзор, так и включение, с тем чтобы мы могли рекомендовать точные и отличающиеся друг от друга предложения, дающие клиентам возможность исследовать новое содержание
Время от времени сотрудничество отсутствует. Холодные стартовые элементы или клиенты холодного старта нуждаются в большем количестве соединений для надежной оценки их сопоставимости сотрудничества, поэтому общие стратегии разделения пренебрегают для создания предложений
Проблемы холодного старта могут быть уменьшены, когда учитывается подобие персонажа. Вы можете кодировать качества в двоичный вектор и скормить его рекомендующему.
Вещи, скомпонованные в зависимости от их сходства с соединениями и имущественного сходства, часто регулируются.