Theoretisch

Wij bereidden een reusachtig, diepgaand convolutioneel neuraal systeem voor om de 1,3 miljoen hoge-doelenbeelden in de LSVRC-2010 ImageNet voor te bereiden die in de 1000 unieke klassen worden geplaatst. Op de test informatie hebben we top-1 en top-5 blunder tempo’s van 39,7% en 18,9% bereikt, die uitgebreid superieur zijn aan de beste resultaten uit het verleden in de klas. Het neurale systeem, dat 60 miljoen parameters en 500.000 neuronen heeft, bestaat uit vijf convolutionele lagen, waarvan sommige worden gevolgd door max-pooling lagen, en twee internationaal geassocieerde lagen met een laatste 1000-weg softmax. Om de voorbereiding sneller te laten verlopen, hebben we gebruik gemaakt van niet-onderdompelende neuronen en een productief GPU-gebruik van convolutionele netten. Om overfitting in de internationaal geassocieerde lagen te verminderen, hebben we een andere regularisatiestrategie gebruikt die uitzonderlijk succesvol bleek te zijn.