Il set di dati CIFAR-10 comprende 60000 immagini di ombreggiatura 32×32 in 10 classi, con 6000 immagini per ogni classe. Il dataset è suddiviso in cinque gruppi di preparazione e un gruppo di prova, ciascuno con 10000 immagini. Il gruppo di prova contiene esattamente 1000 immagini scelte a caso per ogni classe. I gruppi di preparazione contengono il resto delle immagini nelle richieste arbitrarie, ma alcuni gruppi di preparazione possono contenere un numero maggiore di immagini di una classe rispetto ad un’altra. Tra di essi, i gruppi di preparazione contengono esattamente 5000 immagini di ogni classe.

Ecco le classi del dataset, così come 10 immagini irregolari di ciascuna: Ci sono 50000 immagini di preparazione e 10000 immagini di prova.

Le classi sono totalmente estranee. Non c’è copertura tra veicoli e camion. “Auto” comprende veicoli, SUV, cose di questo tipo. Il termine “camion” comprende solo camion enormi. Nessuno dei due incorpora i pick-up.

Risultati del modello

Potete scoprire alcuni risultati replicabili di benchmark su questo set di dati nella pagina dei compiti di cuda-convnet. Questi risultati sono stati ottenuti con un sistema neurale convoluzionale. Rapidamente, sono un errore di test del 18% senza crescita delle informazioni e dell’11% con. Inoltre, Jasper Snoek ha un altro documento in cui ha utilizzato l’avanzamento dell’iperparametro bayesiano per scoprire le impostazioni decenti del marciume del peso e diversi iperparametri, che gli ha permesso di ottenere un errore di test del 15% (senza aumento delle informazioni) utilizzando l’ingegneria della rete che ha ottenuto il 18%.

Risultati diversi

Rodrigo Benenson è stato abbastanza benevolo da raccogliere risultati su CIFAR-10/100 e su diversi set di dati sul suo sito; clicca qui per vedere.

Design del set di dati

Rendimenti di Python/Matlab

Descriverò il disegno dell’adattamento del Python del set di dati. Il disegno dell’adattamento di Matlab è indistinguibile.

La cronaca contiene i documenti data_batch_1, data_batch_2, …, data_batch_5, proprio come test_batch. Ognuno di questi documenti è un oggetto Python “curato” consegnato con cPickle. Ecco una routine di Python2 che aprirà un tale record e restituirà una parola di riferimento:

def unpickle(file):

    importazione cPickle

    con open(file, ‘rb’) come fo:

        dict = cPickle.load(fo)

    dettato del ritorno

E una versione Python3:

def unpickle(file):

    importazione sottaceti

    con open(file, ‘rb’) come fo:

        dict = sottaceto.carico(fo, encoding=’byte’)

    dettato del ritorno

Accatastati lungo queste linee, ogni record del gruppo contiene una parola di riferimento con i componenti che lo accompagnano:

informazioni – un’esposizione 10000×3072 di uint8s. Ogni linea del cluster memorizza un’immagine ombreggiante 32×32. Le 1024 sezioni iniziali contengono le stime del canale rosso, le seguenti 1024 il verde e le ultime 1024 il blu. L’immagine è messa via in push richiesta significativa, con l’obiettivo che i 32 passaggi iniziali della mostra siano le stime del canale rosso della colonna principale dell’immagine.

nomi – una serie di 10000 numeri nell’intervallo 0-9. Il numero nella lista I mostra il marchio dell’iesima immagine nelle informazioni della mostra.

Forma doppia

Il modulo doppio contiene i documenti data_batch_1.bin, data_batch_2.bin, …, data_batch_5.bin, proprio come test_batch.bin. Ognuno di questi documenti è concepito come inseguimento:

<1 x etichetta><3072 x pixel><3072 x pixel

<1 x etichetta><3072 x pixel><3072 x pixel

Alla fine della giornata, il byte principale è il nome dell’immagine principale, che è un numero nell’intervallo 0-9. I seguenti 3072 byte sono le stime dei pixel dell’immagine. I 1024 byte iniziali sono le stime del canale rosso, i successivi 1024 il verde e gli ultimi 1024 il blu. Le qualità sono messe via in richieste significative, quindi i 32 byte iniziali sono le stime del canale rosso della linea primaria dell’immagine.

Ogni record contiene 10000 “linee” di immagini da 3073 byte, nonostante non ci sia nulla a delimitare le linee. In questo modo ogni record dovrebbe avere una lunghezza effettiva di 30730000 byte.

C’è un altro record, chiamato batches.meta.txt. Si tratta di un record ASCII che mappa i segni numerici nell’intervallo 0-9 a nomi di classi importanti. E’ solo un sommario dei 10 nomi di classe, uno per ogni riga. Il nome della classe su push I si riferisce al segno numerico I.

Il set di dati CIFAR-100

Questo set di dati è molto simile al CIFAR-10, con l’eccezione che ha 100 classi contenenti 600 immagini ciascuna. Ci sono 500 immagini di preparazione e 100 immagini di prova per ogni classe. Le 100 classi del CIFAR-100 sono raccolte in 20 superclassi. Ogni immagine accompagna un marchio “fine” (la classe a cui ha un posto) e un nome “grossolano” (la superclasse a cui ha un posto).

Ecco l’elenco delle classi del CIFAR-100:

SuperclassClassClasse

mammiferi anfibi castoro , delfino, lontra, foca, balena, balena

pesci fishaquarium , pesci piatti, trave, squali, trote

flowersorchids , papaveri, rose, girasoli, tulipani

nutrimento contenitoribottiglie , ciotole, ciotole, barattoli, tazze, tazze, piatti

prodotti della terra, funghi, arance, pere, pere, peperoni dolci

unità di famiglia dispositivi elettrici , console PC, luce, telefono, TV

mobili per famiglia letto , seduta, seduta d’amore, tavolo, armadio

ape , scarabeo, farfalla, bruco, scarafaggio, scarafaggio

enorme carnivoro , pantera, leone, tigre, lupo, tigre, lupo

enorme ponte all’aperto fatto dall’uomo , maniero, casa, strada, grattacielo

enorme scenografia regolare all’aperto , boschi, montagna, pianura, oceano

enormi onnivori ed erbivori , manzi, scimpanzé, elefante, canguro

mammalsfox di medie dimensioni , porcospino, opossum, procione, puzzola

granchio invertebrato non strisciante , aragosta, lumaca, aracnide, verme

peoplebaby , ragazzo, giovane donna, uomo, donna

rettilecrocodile , dinosauro, rettile, serpente, tartaruga

piccolo mammalshamster , topo, lepre, lepre, donzella, scoiattolo

treemaple , quercia, palma, pino, salice

veicoli 1bicicletta , trasporto, incrociatore, camioncino, treno

veicoli 2lawn-cutter , razzo, tram, serbatoio, trattore