Il set di dati CIFAR-10 comprende 60000 immagini di ombreggiatura 32×32 in 10 classi, con 6000 immagini per ogni classe. Il dataset è suddiviso in cinque gruppi di preparazione e un gruppo di prova, ciascuno con 10000 immagini. Il gruppo di prova contiene esattamente 1000 immagini scelte a caso per ogni classe. I gruppi di preparazione contengono il resto delle immagini nelle richieste arbitrarie, ma alcuni gruppi di preparazione possono contenere un numero maggiore di immagini di una classe rispetto ad un’altra. Tra di essi, i gruppi di preparazione contengono esattamente 5000 immagini di ogni classe.
Ecco le classi del dataset, così come 10 immagini irregolari di ciascuna: Ci sono 50000 immagini di preparazione e 10000 immagini di prova.

Le classi sono totalmente estranee. Non c’è copertura tra veicoli e camion. “Auto” comprende veicoli, SUV, cose di questo tipo. Il termine “camion” comprende solo camion enormi. Nessuno dei due incorpora i pick-up.
Risultati del modello
Potete scoprire alcuni risultati replicabili di benchmark su questo set di dati nella pagina dei compiti di cuda-convnet. Questi risultati sono stati ottenuti con un sistema neurale convoluzionale. Rapidamente, sono un errore di test del 18% senza crescita delle informazioni e dell’11% con. Inoltre, Jasper Snoek ha un altro documento in cui ha utilizzato l’avanzamento dell’iperparametro bayesiano per scoprire le impostazioni decenti del marciume del peso e diversi iperparametri, che gli ha permesso di ottenere un errore di test del 15% (senza aumento delle informazioni) utilizzando l’ingegneria della rete che ha ottenuto il 18%.
Risultati diversi
Rodrigo Benenson è stato abbastanza benevolo da raccogliere risultati su CIFAR-10/100 e su diversi set di dati sul suo sito; clicca qui per vedere.
Design del set di dati
Rendimenti di Python/Matlab
Descriverò il disegno dell’adattamento del Python del set di dati. Il disegno dell’adattamento di Matlab è indistinguibile.
La cronaca contiene i documenti data_batch_1, data_batch_2, …, data_batch_5, proprio come test_batch. Ognuno di questi documenti è un oggetto Python “curato” consegnato con cPickle. Ecco una routine di Python2 che aprirà un tale record e restituirà una parola di riferimento:
def unpickle(file):
importazione cPickle
con open(file, ‘rb’) come fo:
dict = cPickle.load(fo)
dettato del ritorno
E una versione Python3:
def unpickle(file):
importazione sottaceti
con open(file, ‘rb’) come fo:
dict = sottaceto.carico(fo, encoding=’byte’)
dettato del ritorno
Accatastati lungo queste linee, ogni record del gruppo contiene una parola di riferimento con i componenti che lo accompagnano:
informazioni – un’esposizione 10000×3072 di uint8s. Ogni linea del cluster memorizza un’immagine ombreggiante 32×32. Le 1024 sezioni iniziali contengono le stime del canale rosso, le seguenti 1024 il verde e le ultime 1024 il blu. L’immagine è messa via in push richiesta significativa, con l’obiettivo che i 32 passaggi iniziali della mostra siano le stime del canale rosso della colonna principale dell’immagine.
nomi – una serie di 10000 numeri nell’intervallo 0-9. Il numero nella lista I mostra il marchio dell’iesima immagine nelle informazioni della mostra.
Forma doppia
Il modulo doppio contiene i documenti data_batch_1.bin, data_batch_2.bin, …, data_batch_5.bin, proprio come test_batch.bin. Ognuno di questi documenti è concepito come inseguimento:
<1 x etichetta><3072 x pixel><3072 x pixel
…
<1 x etichetta><3072 x pixel><3072 x pixel
Alla fine della giornata, il byte principale è il nome dell’immagine principale, che è un numero nell’intervallo 0-9. I seguenti 3072 byte sono le stime dei pixel dell’immagine. I 1024 byte iniziali sono le stime del canale rosso, i successivi 1024 il verde e gli ultimi 1024 il blu. Le qualità sono messe via in richieste significative, quindi i 32 byte iniziali sono le stime del canale rosso della linea primaria dell’immagine.
Ogni record contiene 10000 “linee” di immagini da 3073 byte, nonostante non ci sia nulla a delimitare le linee. In questo modo ogni record dovrebbe avere una lunghezza effettiva di 30730000 byte.
C’è un altro record, chiamato batches.meta.txt. Si tratta di un record ASCII che mappa i segni numerici nell’intervallo 0-9 a nomi di classi importanti. E’ solo un sommario dei 10 nomi di classe, uno per ogni riga. Il nome della classe su push I si riferisce al segno numerico I.
Il set di dati CIFAR-100
Questo set di dati è molto simile al CIFAR-10, con l’eccezione che ha 100 classi contenenti 600 immagini ciascuna. Ci sono 500 immagini di preparazione e 100 immagini di prova per ogni classe. Le 100 classi del CIFAR-100 sono raccolte in 20 superclassi. Ogni immagine accompagna un marchio “fine” (la classe a cui ha un posto) e un nome “grossolano” (la superclasse a cui ha un posto).
Ecco l’elenco delle classi del CIFAR-100:
SuperclassClassClasse
mammiferi anfibi castoro , delfino, lontra, foca, balena, balena
pesci fishaquarium , pesci piatti, trave, squali, trote
flowersorchids , papaveri, rose, girasoli, tulipani
nutrimento contenitoribottiglie , ciotole, ciotole, barattoli, tazze, tazze, piatti
prodotti della terra, funghi, arance, pere, pere, peperoni dolci
unità di famiglia dispositivi elettrici , console PC, luce, telefono, TV
mobili per famiglia letto , seduta, seduta d’amore, tavolo, armadio
ape , scarabeo, farfalla, bruco, scarafaggio, scarafaggio
enorme carnivoro , pantera, leone, tigre, lupo, tigre, lupo
enorme ponte all’aperto fatto dall’uomo , maniero, casa, strada, grattacielo
enorme scenografia regolare all’aperto , boschi, montagna, pianura, oceano
enormi onnivori ed erbivori , manzi, scimpanzé, elefante, canguro
mammalsfox di medie dimensioni , porcospino, opossum, procione, puzzola
granchio invertebrato non strisciante , aragosta, lumaca, aracnide, verme
peoplebaby , ragazzo, giovane donna, uomo, donna
rettilecrocodile , dinosauro, rettile, serpente, tartaruga
piccolo mammalshamster , topo, lepre, lepre, donzella, scoiattolo
treemaple , quercia, palma, pino, salice
veicoli 1bicicletta , trasporto, incrociatore, camioncino, treno
veicoli 2lawn-cutter , razzo, tram, serbatoio, trattore