Teoretyczne

Przygotowaliśmy ogromny, głęboki, konwulsyjny system neuronowy do zaaranżowania 1,3 miliona zdjęć high-goala w sieci LSVRC-2010 ImageNet przygotowując zestaw do 1000 unikalnych klas. Na podstawie informacji testowych uzyskaliśmy wyniki z top-1 i top-5, które wyniosły 39,7% i 18,9%, co znacznie przewyższa dotychczasowe najlepsze wyniki w klasie. System neuronowy, który ma 60 milionów parametrów i 500,000 neuronów, składa się z pięciu warstw fałdowych, z których niektóre są ciągnięte przez warstwy max-poolingowe, oraz dwóch powiązanych międzynarodowo warstw z ostatnim 1000-way softmaxem. Aby przyspieszyć przygotowanie, wykorzystaliśmy neurony nieimmerujące i wydajne układy GPU wykorzystujące siatki faliste. Aby zredukować overfitting w warstwach powiązanych międzynarodowo, zastosowaliśmy inną strategię regularyzowania, która okazała się wyjątkowo skuteczna.