Comme les ensembles de données augmentent considérablement, nous développons des compétences pour améliorer la façon dont nous formons les réseaux neuronaux profonds. Cela aide les scientifiques à cartographier les entrées et les sorties tout en étiquetant d’énormes quantités de données. Ces données comprennent des prédictions, des phrases, des images, etc.
Nous ne sommes pas encore en mesure de généraliser les différences entre les conditions qui contribuent à la formation des données. Permettre au modèle de réaliser de telles activités dans le monde réel peut être une tâche ardue. Comme le modèle comporte de nombreuses situations nouvelles et désordonnées, il se heurtera à des problèmes auxquels les données d’entraînement ne sont pas prêtes.
L’algorithme doit faire de nouvelles prédictions pour résoudre des situations compliquées et réelles. Dans cet article, nous verrons comment transférer les données aux nouvelles conditions. Ce blog permettra de comprendre comment les modèles peuvent adopter l’apprentissage par transfert et développer un modèle d’apprentissage supervisé réussi et étendu.

Comprendre l’apprentissage par transfert

L’apprentissage par transfert n’est pas une nouvelle approche de l’apprentissage approfondi. Bien qu’il soit différent de la méthode traditionnelle de création et de formation de modèles d’apprentissage automatique pour suivre une méthode de transfert de données, il existe de nombreuses similitudes. Les principales racines des méthodes traditionnelles sont spécifiques à la formation, aux ensembles de données et aux tâches basées sur des modèles isolés.
Le modèle n’inclut aucune connaissance qu’il retient d’autres modèles. Lorsqu’il s’agit de transférer l’apprentissage, vous pouvez contrôler les ensembles de données de formation dans de nouveaux modèles et traiter des problèmes tels que l’exécution de nouvelles tâches avec moins de données.
Vous pouvez comprendre cette approche à l’aide d’un exemple. Supposons que nous voulions identifier différents objets dans un domaine restreint d’une entreprise de commerce électronique. Supposons que vous exécutez la tâche 1 en tant que T1. Vous allez alors fournir le modèle de différents ensembles de données et les régler pour effectuer des points de données invisibles à partir du même point de données ou domaine de commerce électronique.
L’algorithme traditionnel d’apprentissage machine décompose les tâches dans les domaines donnés si les données ne sont pas suffisantes. Supposons que le modèle détecte des photos de vêtements pour un site de commerce électronique. Il peut s’agir de la tâche 2 ou T2. Idéalement, vous devriez pouvoir utiliser l’ensemble de données ou les images d’un modèle T1 formé à un autre T2. Mais nous ne rencontrons pas de situation similaire et ne parvenons pas à améliorer les performances du modèle. Cela a de nombreux objectifs, comme par exemple biaiser le modèle pour former le domaine.
Avec l’apprentissage par transfert, nous devrions être en mesure d’utiliser les données d’un modèle formé à de nouveaux modèles connexes. Si nous avons plus de données dans la tâche T1, nous pouvons utiliser les connaissances telles que la couleur et la taille de la chemise pour le modèle qui a moins de connaissances, c’est-à-dire T2. Lorsqu’il y a un problème dans le domaine de la vision par ordinateur, vous pouvez transférer les caractéristiques à différentes tâches et améliorer les connaissances. En d’autres termes, vous pouvez utiliser les connaissances d’une tâche comme une entrée de l’autre pour effectuer de nouvelles tâches.

Stratégies de transfert des connaissances

L’apprentissage par transfert comporte de nombreuses techniques et stratégies d’apprentissage, que vous pouvez appliquer à vos projets en fonction du domaine, des données disponibles et des tâches. Vous trouverez ci-dessous quelques-unes de ces stratégies et techniques :

1. Apprentissage par transfert non supervisé

Le domaine cible et les sources sont similaires, tandis que les tâches et les activités sont différentes. Dans ce cas, les données étiquetées ne sont disponibles dans aucun domaine. Les techniques inductives et non supervisées sont similaires pour le domaine cible.

2. Apprentissage par transfert transductif

Dans cet état, les tâches cibles et sources sont similaires, mais il existe des différences dans des domaines connexes. Il y a beaucoup de données étiquetées dans le domaine source, alors qu’il n’y a aucune donnée dans le domaine cible. Vous pouvez les classer dans différentes sous-catégories, en vous référant à des paramètres dissemblables.

3. Apprentissage par transfert inductif

Les domaines cible et source sont les mêmes, mais leurs tâches sont différentes. Les algorithmes utilisent les biais inductifs du domaine source et aident à améliorer la tâche cible. Vous pouvez diviser les données étiquetées en deux catégories : l’apprentissage autodidacte et l’apprentissage multitâche.

Apprentissage par transfert pour un apprentissage approfondi

Toutes les stratégies ci-dessus sont des approches générales que nous pouvons appliquer dans le modèle d’apprentissage machine. Cela soulève diverses questions, telles que “pouvons-nous appliquer l’apprentissage par transfert dans le contexte de l’apprentissage profond ? Les modèles d’apprentissage profond aident les modèles d’apprentissage inductif. Un algorithme d’apprentissage inductif peut aider à cartographier les exemples de formation.
Par exemple, le modèle apprendra le mappage en classant les étiquettes de classe et les caractéristiques d’entrée. Ces types de modèles d’apprentissage généralisent les données invisibles. De plus, l’algorithme fonctionnera selon les hypothèses, en fonction de la distribution des données de formation.
Les experts appellent ces hypothèses un biais inductif. À l’aide d’hypothèses ou de biais inductifs, vous pouvez caractériser de multiples facteurs. Par exemple, l’espace des hypothèses restreint le processus de recherche, et il aura un grand impact sur le processus d’apprentissage du modèle basé sur un domaine et une tâche donnés.

Conclusion

Pour conclure, on peut dire que de nombreuses directions de recherche transfèrent les offres d’apprentissage. De nombreuses applications qui contribuent au transfert des connaissances ont besoin de modèles pour adopter de nouvelles tâches dans les nouveaux domaines.