Подготовка модели ML включает в себя расчет ML (т.е. расчет обучения) с подготовкой информации для извлечения пользы. Термин ML model ссылается на древнюю раритетность модели, которая создается в процессе подготовки.
Подготовительная информация должна содержать правильный ответ, который называется объективным или целевым свойством. Обучающий расчет обнаруживает конструкции в подготовительной информации, которые направляют информацию, описывающую цель (соответствующий ответ, который вы должны предвидеть), и дает модель ML, которая улавливает эти примеры.
Вы можете использовать модель ML для получения прогнозов по новой информации, для которой у вас нет самого туманного представления об объекте. Например, предположим, что Вам необходимо подготовить модель ML, чтобы предсказать, является ли письмо спамом или нет. Вы бы предоставили Amazon ML подготовленную информацию, содержащую сообщения, для которых вы знаете цель (то есть имя, которое говорит о том, является ли письмо спамом или нет). Amazon ML будет готовить модель ML, используя эту информацию, создавая модель, которая пытается предугадать, будет ли новое электронное сообщение представлять собой спам или нет.
Типы моделей ML
Amazon ML поддерживает три вида моделей ML: параллельная характеристика, многоклассовая группировка и рецидив. Тот тип модели, который вы должны выбрать, зависит от того, на какой фокус вы должны ориентироваться.
Модель параллельной организации
Модели ML для задач параллельного расположения предполагают двойной результат (один из двух потенциальных классов). Для подготовки моделей двойной группировки Amazon ML использует расчет бизнес-стандарта обучения, известный как стратегический рецидив.
Случаи возникновения вопросов по определению парных характеристик
“Это электронный спам или не спам?”
“Купит ли клиент эту вещь?”
“Этот предмет – книга или скот?”
“Этот аудит состоит из клиента или робота?”
Модель характеризации мультикласса
Модели ML для многоклассовых задач характеризации позволяют создавать ожидания для многочисленных классов (предвидеть один из множества результатов). Для подготовки многоклассных моделей Amazon ML использует расчет бизнес-стандарта обучения, известный как мультиномиальный стратегический рецидив.
Случаи многоклассовых проблем
“Этот предмет – книга, кинофильм или наряд?”
“Эта кинокартина – беззаботная комедия, повествование или позвоночник?”
“Какая классификация предметов наиболее интригующая для этого клиента?”
Модель реляпса
Модели ML для рецидивов предусматривают числовую ценность. Для подготовки моделей рецидивов Amazon ML использует расчет бизнес-стандарта обучения, известный как прямой рецидив.
Создание модели ML
После того, как вы сделали источник данных, вы готовы сделать модель ML. В случае, если вы используете поддержку Amazon AI для создания модели, вы можете принять решение об использовании настроек по умолчанию или откорректировать модель, применив пользовательские альтернативы.
Обычные альтернативы включают в себя:
Настройки оценки: Вы можете принять решение о том, чтобы Amazon ML сохранила часть информации для оценки предвиденной природы модели ML. Данные об оценках см. в разделе “Оценка моделей МЛ”.
Формула: Формула показывает Amazon ML, какие качества и изменения свойств доступны для подготовки модели. Данные о планах Amazon ML см. в разделе Изменения в информационных планах.
Параметры подготовки: Параметры контролируют определенные свойства процедуры подготовки и последующей модели ML. Дополнительные сведения о параметрах подготовки см. в разделе Параметры подготовки.
Чтобы выбрать или определить значения для этих параметров, выберите Пользовательский выбор при использовании мастера Make ML Model. Если вам нужно, чтобы Amazon ML применял настройки по умолчанию, выберите пункт Default (По умолчанию).
В момент создания модели ML, Amazon ML выбирает тип расчета обучения, который будет использоваться в зависимости от характерного качества вашей цели. Если ваша объективная характеристика двойная, Amazon ML делает модель двойного порядка, которая использует вычисление стратегического рецидива. Если Ваша объективная характеристика “Все” отсутствует, Amazon ML создает мультиклассную модель, в которой используется вычисление рецидивов по мультиномиальному методу. На случай, если Ваша объективная характеристика является Числовой, Amazon ML делает модель рецидива, которая использует расчет прямого рецидива.
Баллы
Требования
Создание модели ML с выбором по умолчанию
Создание модели ML с пользовательскими выборами
Требования
Прежде чем использовать поддержку Amazon ML для создания модели ML, необходимо сделать два источника данных, один для подготовки модели, а другой для оценки модели. На случай, если вы не сделали два источника данных, см. Этап 2: Подготовка источника данных в учебном упражнении.
Создание модели ML с выбором по умолчанию
Выберите вариант по умолчанию, если вам нужно, чтобы Amazon ML:
Разделите информацию, чтобы использовать начальные 70 процентов для подготовки и оставшиеся 30 процентов для оценки.
Рекомендовать формулу, зависящую от информации, собранной из источника подготовительных данных, который составляет 70 процентов от источника информационных данных.
Выберите параметры подготовки по умолчанию
Чтобы выбрать альтернативы по умолчанию
В поддержке Amazon ML выбирайте Amazon AI, а после – модели ML.
На странице синопсиса моделей ML выберите Make another ML model (Сделать другую модель ML).
На странице информации убедитесь, что я ранее сделал источник данных, указывающий на то, что выбрана моя информация S3.
В таблице выберите источник данных, а затем выберите Приступить.
На странице настроек модели ML, для имени модели ML, введите имя модели ML.
Для подготовки и оценки параметров убедитесь, что выбрано значение по умолчанию.
Для Name (Имя) введите имя для оценки, а затем выберите Survey (Опрос). Amazon ML обходит в сторону оставшуюся часть мастера и переходит на страницу опроса.
Просмотрите информацию о себе, удалите все метки, дублированные в источнике данных, которые вам не нужно применять к модели и оценкам, а затем выберите пункт Готово.
Создание модели ML с пользовательскими выборами
Тонкая настройка вашей модели ML позволяет вам это сделать:
Дайте свою собственную формулу. Информацию о том, как дать свою собственную формулу, см. в Справочнике по организации формул.
Выберите параметры подготовки. Дополнительные сведения о параметрах подготовки см. в разделе Параметры подготовки.
Выберите пропорцию разделения подготовки/оценки, отличную от пропорции 70/30 по умолчанию, или укажите другой источник данных, который вы только что организовали для оценки. Для получения данных о методах расставания см. раздел “Расставание с информацией”.
Вы также можете выбрать значения по умолчанию для любого из этих параметров.
Если вы только что сделали модель, использующую альтернативы по умолчанию, и нуждаетесь в улучшении предвиденного представления вашей модели, воспользуйтесь пользовательским выбором, чтобы сделать другую модель с некоторыми подкорректированными настройками. Например, вы можете добавить дополнительные изменения компонентов в формулу или увеличить количество переходов в параметре подготовки.
Сделать модель с индивидуальными альтернативами
В поддержке Amazon ML выбирайте Amazon AI, а затем – модели ML.
На странице синопсиса моделей ML выберите Make another ML model (Сделать другую модель ML).
На случай, если вы только что сделали источник данных, на странице Info information (Информация об информации) выберите опцию I, в которой я ранее сделал источник данных, указывающий на мою информацию S3. В таблице выберите свой источник данных, а затем выберите Приступить.
Если вы хотите сделать источник данных, выберите Моя информация находится в S3, и я должен сделать источник данных, выберите Приступить. Вы перенаправляетесь к мастеру “Сделать источник данных”. Укажите, находится ли ваша информация в S3 или в Redshift, на этом этапе выберите Подтвердить. Заполните систему для создания источника данных.
После того, как вы сделали источник данных, вы перенаправляетесь на последующий этап в мастере Make ML Model.
На странице настроек модели ML, для имени модели ML, введите имя модели ML.
В разделе Выбор параметров подготовки и оценки выберите пункт Пользовательский, а затем Приступить.
На странице Формулы можно переделать формулу. На случай, если Вы предпочтете не менять формулу, Amazon ML предложит ее для Вас. Выберите продолжение.
На странице Прогрессивные настройки укажите Самый экстремальный размер модели ML, Самое большое количество передач информации, Тип Смешивания для подготовки информации, Тип Регуляризации и Сумму Регуляризации. Если вы не укажете их, Amazon ML использует параметры подготовки по умолчанию.
Дополнительные сведения об этих параметрах и их настройках по умолчанию см. в разделе Подготовительные параметры.
Выберите продолжение.
На странице “Оценка” укажите, нужно ли вам сразу же оценить модель ML. Если Вы предпочитаете не оценивать модель ML в настоящее время, выберите Survey (Опрос).
На данный момент вам необходимо оценить модель ML:
Для Назовите эту оценку, введите название оценки.
Для выбора информации об оценке выберите, нужно ли вам Amazon ML хранить часть информации для оценки, и если нужно, то как вам нужно разделить источник данных на части, или решите предоставить альтернативный источник данных для оценки.
Pick Survey.
На странице Просмотр отредактируйте свои выделения, удалите все теги, скопированные из источника данных, которые вы не хотите применять к своей модели и оценкам, а затем выберите Готово.