Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Le biais et la variance sont deux erreurs de prédiction principales qui se produisent principalement lors d’un modèle d’apprentissage machine. L’apprentissage machine résout de nombreux problèmes qui nous préoccupent. Grâce à l’apprentissage machine, nous pouvons effectuer des activités que nous n’étions pas capables d’effectuer auparavant.
Comme l’apprentissage machine résout la plupart des problèmes, nous sommes confrontés à divers défis. Ceux-ci peuvent être menaçants et affecteront le résultat du mode. C’est pourquoi nous devons comprendre et résoudre ces prédictions.
Pour concevoir un modèle d’apprentissage machine, nous devons alimenter toutes les données importantes afin que le modèle puisse faire des prédictions et développer de nouvelles données par lui-même. Les écarts rendront un modèle d’ajustement différent des paramètres que vous aurez définis. La gestion des écarts et des biais est frustrante car vous ne pouvez pas lancer votre modèle ou démontrer les compétences du modèle si les résultats ne sont pas précis.

Apprentissage supervisé

Le compromis entre biais et variance n’est applicable que dans l’apprentissage machine supervisé. Le plus important est que vous utilisiez ces prédictions dans la modélisation prédictive. Ce compromis permettra de corriger l’erreur de prédiction afin que vous puissiez analyser les performances de votre algorithme.
Chaque modèle d’apprentissage machine comprend un algorithme que vous entraînez à l’aide de données pertinentes. L’algorithme répète le même modèle et améliore la capacité du modèle en créant de nouvelles données à l’aide des données d’apprentissage.
Il existe plusieurs algorithmes que vous pouvez choisir pour vos modèles d’apprentissage machine. Voici quelques-uns de ces algorithmes :
– Réseaux de neurones
– Arbres de décision
– SVM
– Régression linéaire
Tous les algorithmes ci-dessus sont différents les uns des autres. Le style de travail de l’algorithme et la façon dont ils traitent les données diffèrent tous. La quantité de Variance et de Biais génère la différence la plus importante entre ces algorithmes.

Modèle final

Après avoir décidé de l’algorithme et des paramètres que vous utilisez pour votre projet, vous préparez votre modèle final en y insérant les données. Vous fournissez beaucoup de données au modèle d’apprentissage machine. Vous devez maintenant former ces ensembles de données et continuer à les tester jusqu’à ce que vous commenciez à trouver des résultats. Le modèle vous aidera à générer la prédiction à partir des données précédentes et à développer de nouvelles données.

Types d’erreurs de prédiction

L’algorithme du modèle d’apprentissage machine comprendra ces trois types d’erreurs de prédiction :
– Variance
– Biais
– Erreur irréductible

Qu’est-ce que la partialité ?

La différence entre la valeur cible et la prédiction du modèle est appelée biais. Vous pouvez modifier le biais d’un projet en changeant l’algorithme ou le modèle. Lorsque les hypothèses que vous utilisez dans le modèle sont simples, vous subissez un biais.
Vous pouvez dériver la valeur moyenne de la prédiction en répétant le processus de construction du modèle et en effectuant le processus d’échantillonnage. Vous pouvez extraire les données de rééchantillonnage du modèle en utilisant l’ensemble des données de formation et en générant des résultats précis. Vous pouvez rééchantillonner à partir de différentes méthodes telles que le bootstrapping et l’échantillonnage par pli K.
Lorsque vous ré-échantillonnez les données, vous modifiez le biais. Vous trouverez un niveau élevé de biais en mesurant la différence entre les valeurs réelles des données de l’échantillon et la valeur moyenne de prédiction. Si un modèle est biaisé, vous constaterez qu’il est sous-adapté. Chaque modèle comporte un certain biais.
Vous trouverez un biais élevé dans un algorithme linéaire. C’est pourquoi ces algorithmes stimulent le processus d’apprentissage de la machine. Vous trouverez également un biais dans l’analyse de régression linéaire en raison d’un problème réel qu’un modèle simple ne peut pas résoudre. Vous trouverez un biais faible dans l’algorithme non linéaire. Un modèle simple a plus de biais.

Qu’est-ce qu’une variance ?

Avec Variance, vous pouvez trouver la quantité de la fonction cible que vous devez ajuster si l’algorithme utilise différents ensembles d’entraînement. Pour simplifier, on peut dire qu’une variance vous aide à comprendre la différence entre les variables aléatoires et les valeurs attendues. La variance ne vous aide pas à trouver la précision totale, mais vous pouvez trouver l’irrégularité du modèle en utilisant différentes prédictions à partir de différents ensembles de données d’entraînement.
La variance peut entraîner un surajustement. Dans ce cas, même une petite variation peut causer d’énormes problèmes dans l’ensemble des données. Lorsque vous avez un modèle avec une forte variance, les ensembles de données génèrent un bruit aléatoire au lieu de la fonction cible. Votre modèle doit être capable de comprendre la différence entre les variables et les données d’entrée du résultat.
Cependant, lorsqu’un modèle a une faible variance, la prédiction du modèle sur les données de l’échantillon est proche. Il y aurait un changement énorme dans la projection de la fonction cible pendant l’erreur de variance.
Si un algorithme a une faible variance, vous constaterez une régression logistique, une régression linéaire et une analyse discriminante linéaire dans le modèle. De l’autre côté, avec une variance élevée, vous aurez des voisins proches de k, des arbres de décision et des machines vectorielles de soutien.

Erreur irréductible

Vous ne pouvez pas réduire l’erreur ou le bruit irréductible. Ce sont les données aléatoires que le modèle utilise pour faire la nouvelle prédiction. Vous pouvez considérer ces données comme un ensemble incomplet de caractéristiques, un problème mal cadré ou un caractère aléatoire inhérent.
Pourquoi les biais et les variances sont essentiels
L’algorithme d’apprentissage machine que vous utilisez pour votre projet utilisera ces modèles statistiques ou mathématiques. Grâce à ces calculs, il pourrait développer deux types d’erreurs :
L’erreur récupérable – Vous pouvez minimiser et contrôler cette erreur afin d’améliorer la précision et l’efficacité du résultat.
Erreur irréductible – Ces erreurs sont naturelles, et vous ne pouvez pas supprimer ces incertitudes.
Vous pouvez réduire les biais et les écarts car ce sont des erreurs réductibles. Pour réduire ces erreurs, vous devez sélectionner un modèle présentant une flexibilité et une complexité appropriées. De plus, vous pouvez utiliser des données appropriées pour entraîner le modèle et réduire ces erreurs. Cela vous aidera à améliorer la précision du modèle.

Conclusion

Les biais et la variance sont les éléments essentiels de l’apprentissage machine que vous devez apprendre et comprendre. Vous devez utiliser ces éléments dans le cadre de l’apprentissage machine supervisé. Dans l’apprentissage machine supervisé, l’algorithme apprend grâce à l’ensemble des données de formation et génère de nouvelles idées et données. Vous devez maintenir l’équilibre entre biais et variance, ce qui vous aidera à développer un modèle d’apprentissage machine qui produira des résultats précis.
Quel que soit l’algorithme que vous utilisez pour développer un modèle, vous trouverez initialement Variance et Biais. Lorsque vous modifiez un élément, cela affecte l’autre. Vous ne pouvez donc pas réduire les deux composantes à zéro. Si vous le faites, cela soulèvera d’autres problèmes. C’est pourquoi vous devez utiliser un compromis entre biais et variance. Pour concevoir un modèle sans erreur, vous devez mettre ces deux composantes en évidence.

Langages

Weekly newsletter

No spam. Just the latest releases and tips, interesting articles, and exclusive interviews in your inbox every week.