Pour préparer un modèle de ML, il faut donner un calcul de ML (c’est-à-dire le calcul d’apprentissage) et préparer des informations dont on pourra tirer profit. Le terme de modèle de ML fait allusion à la rareté ancienne du modèle qui est réalisé par la procédure de préparation.

L’information de préparation doit contenir la bonne réponse, ce qui est connu comme une propriété objective ou cible. Le calcul d’apprentissage découvre dans les informations de préparation des modèles qui guident les informations attribuées à l’objectif (la réponse appropriée que vous devez anticiper), et il donne un modèle de ML qui reprend ces exemples.

Vous pouvez utiliser le modèle ML pour obtenir des prévisions sur de nouvelles informations pour lesquelles vous n’avez pas la moindre idée de l’objectif. Par exemple, supposons que vous deviez préparer un modèle de ML pour prévoir si un courriel est un spam ou non. Vous fourniriez à Amazon ML des informations préparatoires qui contiennent des messages dont vous connaissez l’objectif (c’est-à-dire un nom qui indique si un courriel est un spam ou non). Amazon ML préparerait un modèle de ML en utilisant ces informations, ce qui donnerait naissance à un modèle qui s’efforce de prévoir si un nouveau courriel sera un spam ou non

Types de modèles ML

Amazon ML soutient trois sortes de modèles ML : la caractérisation parallèle, le regroupement multiclasse et la rechute. Le type de modèle que vous devez choisir dépend du type d’attention que vous devez prévoir.

Modèle d’arrangement parallèle

Les modèles de ML pour les questions d’arrangements parallèles prévoient un double résultat (une des deux classes potentielles). Pour préparer les modèles de double regroupement, Amazon ML utilise le calcul d’apprentissage standard des entreprises connu sous le nom de rechute stratégique.

Exemples de questions de caractérisation jumelée

“Est-ce du spam ou non ?”

“Le client achètera-t-il cet article ?”

“Cet article est-il un livre ou du bétail ?”

“Cet audit est-il composé par un client ou un robot ?”

Modèle de caractérisation multiclasse

Les modèles ML pour les questions de caractérisation multiclasse vous permettent de produire des attentes pour de nombreuses classes (prévoir un des multiples résultats). Pour préparer les modèles multiclasses, Amazon ML utilise le calcul d’apprentissage standard des entreprises connu sous le nom de rechute stratégique multinomiale.

Exemples de questions multiclasses

“Cet objet est-il un livre, un film ou un vêtement ?”

“Ce film est-il une comédie légère, un récit ou un film qui fait froid dans le dos ?”

“Quelle est la classification des articles qui intrigue le plus ce client ?”

Modèle de rechute

Les modèles de ML pour les problèmes de rechute prévoient une valeur numérique. Pour préparer les modèles de rechute, Amazon ML utilise le calcul d’apprentissage standard des entreprises connu sous le nom de rechute directe.

Créer un modèle de ML

Une fois que vous avez créé une source de données, vous êtes prêt à faire un modèle de ML. Dans le cas où vous utilisez le support Amazon AI pour créer un modèle, vous pouvez décider d’utiliser les paramètres par défaut ou de modifier votre modèle en appliquant des alternatives personnalisées.

Parmi les solutions de rechange personnalisées, on peut citer

Paramètres d’évaluation : Vous pouvez décider de faire sauvegarder par Amazon ML une partie des informations afin d’évaluer le caractère prescient du modèle ML. Pour des données sur les évaluations, voir Évaluation des modèles de ML.

Une formule : Une formule révèle à Amazon ML quelles qualités et quels changements de traits sont accessibles pour la préparation d’un modèle. Pour des données sur les plans Amazon ML, voir Mettre en évidence les changements avec les plans d’information.

Préparation des paramètres : Les paramètres contrôlent certaines propriétés de la procédure de préparation et du modèle de ML ultérieur. Pour plus d’informations sur la préparation des paramètres, voir Préparation des paramètres.

Pour choisir ou déterminer les valeurs de ces paramètres, choisissez le choix personnalisé lorsque vous utilisez l’assistant “Make ML Model”. Si vous avez besoin d’Amazon ML pour appliquer les paramètres par défaut, choisissez Default.

Au moment où vous réalisez un modèle de ML, Amazon ML choisit le type de calcul d’apprentissage qu’il utilisera en fonction du type caractéristique de votre qualité objective. (La propriété objective est le trait qui contient les “bonnes” réponses.) Si votre caractéristique objective est Double, Amazon ML fait un modèle d’ordre double, qui utilise le calcul de rechute stratégique. Si votre caractéristique objective est “All out”, Amazon ML élabore un modèle multiclasse, qui utilise un calcul de rechute multinomial. Au cas où votre caractéristique objective est Numérique, Amazon ML fait un modèle de rechute, qui utilise un calcul de rechute direct.

Points

Exigences

Créer un modèle de ML avec des choix par défaut

Créer un modèle de ML avec des choix personnalisés

Exigences

Avant d’utiliser le support Amazon ML pour réaliser un modèle ML, vous devez créer deux sources de données, l’une pour préparer le modèle et l’autre pour évaluer le modèle. Si par hasard vous n’avez pas créé deux sources de données, voir l’étape 2 : créer une source de données de préparation dans l’exercice pédagogique.

Créer un modèle de ML avec des choix par défaut

Choisissez les choix par défaut, au cas où vous auriez besoin d’Amazon ML pour :

Diviser les informations pour utiliser les 70 % initiaux pour la préparation et utiliser les 30 % restants pour l’évaluation

Recommander une formule dépendant des informations recueillies sur la source de données de préparation, qui représente 70 % de la source de données d’information

Choisir les paramètres de préparation par défaut

Pour choisir les alternatives par défaut

Dans le support Amazon ML, choisissez Amazon AI, et ensuite, choisissez les modèles ML.

Sur la page synopsis des modèles de ML, choisissez Faire un autre modèle de ML.

Sur la page d’information, assurez-vous que j’ai préalablement fait une source de données indiquant que mes informations S3 sont choisies.

Dans le tableau, choisissez votre source de données, et ensuite choisissez Continuer.

Sur la page des paramètres du modèle ML, pour le nom du modèle ML, tapez un nom pour votre modèle ML.

Pour les paramètres de préparation et d’évaluation, assurez-vous que la valeur par défaut est choisie.

Pour Nom, cette évaluation, tapez un nom pour l’évaluation, et ensuite choisissez Enquête. Amazon ML contourne le reste de l’assistant et vous amène à la page Enquête.

Passez en revue vos informations, effacez les étiquettes dupliquées de la source de données dont vous n’avez pas besoin et appliquez-les à votre modèle et à vos évaluations, puis sélectionnez Terminer.

Créer un modèle de ML avec des choix personnalisés

Le fait de modifier votre modèle de ML vous permet de le faire :

Donnez votre propre formule. Pour savoir comment donner votre propre formule, voir la référence de l’organisation des formules.

Choisissez les paramètres de préparation. Pour plus d’informations sur la préparation des paramètres, voir Préparation des paramètres.

Choisissez une proportion de séparation préparation/évaluation autre que la proportion 70/30 par défaut ou donnez une autre source de données que vous venez d’organiser pour l’évaluation. Pour obtenir des données sur les techniques de séparation, consultez la section “Partage de l’information”.

Vous pouvez également choisir les estimations par défaut pour chacun de ces paramètres.

Dans le cas où vous venez de créer un modèle en utilisant les alternatives par défaut et que vous devez améliorer la présentation de votre modèle, utilisez le choix Personnalisé pour créer un autre modèle avec des paramètres modifiés. Par exemple, vous pouvez ajouter d’autres changements de composants à la formule ou augmenter la quantité d’entrées dans le paramètre de préparation.

Réaliser un modèle avec des alternatives personnalisées

Dans le support Amazon ML, choisissez Amazon AI, et ensuite choisissez les modèles ML.

Sur la page synopsis des modèles de ML, choisissez Faire un autre modèle de ML.

Si par hasard vous venez de créer une source de données, sur la page d’information Info, choisissez J’ai créé une source de données en indiquant mes informations S3. Dans le tableau, choisissez votre source de données, puis cliquez sur Continuer.

Au cas où vous devriez créer une source de données, sélectionnez Mes informations sont dans S3, et je dois créer une source de données, sélectionnez Continuer. Vous êtes redirigé vers l’assistant “Créer une source de données”. Indiquez si vos informations se trouvent dans S3 ou Redshift, puis sélectionnez Confirmer. Complétez le système pour créer une source de données.

Après avoir créé une source de données, vous êtes redirigé vers l’étape suivante dans l’assistant de création de modèle de ML.

Sur la page des paramètres du modèle ML, pour le nom du modèle ML, tapez un nom pour votre modèle ML.

Dans Sélectionner les paramètres de préparation et d’évaluation, choisissez Personnaliser, puis choisissez Procéder.

Sur la page Formule, vous pouvez refaire une formule. Au cas où vous préféreriez ne pas modifier une formule, Amazon ML vous en propose une. Choisissez Procéder.

Sur la page Paramètres propulsés, indiquez la Taille du modèle ML le plus extrême, le Plus grand nombre de passages d’informations, le Type de mélange pour la préparation des informations, le Type de régularisation et la Somme de régularisation. Si par hasard vous ne les indiquez pas, Amazon ML utilise les paramètres de préparation par défaut.

Pour plus d’informations sur ces paramètres et leurs valeurs par défaut, voir Préparation des paramètres.

Choisir Procéder.

Sur la page Évaluation, indiquez si vous devez évaluer le modèle de ML immédiatement. Si vous préférez ne pas évaluer le modèle de blanchiment d’argent pour l’instant, choisissez “Enquête”.

Au cas où vous auriez besoin d’évaluer le modèle de ML à ce stade :

Pour Nom de cette évaluation, tapez un nom pour l’évaluation.

Pour les informations sur l’évaluation Select, choisissez si vous avez besoin d’Amazon ML pour détenir une partie des informations pour l’évaluation et, dans l’affirmative, comment vous devez séparer la source de données, ou décidez de donner une autre source de données à l’évaluation.

Enquête sur le choix.

Sur la page Révision, modifiez vos sélections, supprimez les balises copiées de la source de données que vous ne voulez pas appliquer à votre modèle et à vos évaluations, puis choisissez Terminer.