Théorique

Nous avons préparé un énorme et profond système neuronal convolutionnel pour organiser les 1,3 million d’images à haut rendement du réseau ImageNet de la LSVRC-2010 en 1000 classes uniques. Sur la base des informations recueillies lors du test, nous avons obtenu des résultats de 39,7 % et 18,9 % pour les erreurs de classement dans le top 1 et le top 5, ce qui est largement supérieur aux résultats obtenus par les meilleurs de la classe. Le système neuronal, qui compte 60 millions de paramètres et 500 000 neurones, comprend cinq couches convolutionnelles, dont certaines sont suivies par des couches de max-pooling, et deux couches associées au niveau international avec un dernier softmax à 1000 voies. Pour accélérer la préparation, nous avons utilisé des neurones non immergés et une utilisation productive du GPU des réseaux convolutionnels. Pour réduire le suréquipement des couches associées au niveau international, nous avons utilisé une autre stratégie de régularisation qui s’est avérée exceptionnellement efficace.