O conjunto de dados CIFAR-10 é composto de 60000 fotos de sombreamento 32×32 em 10 classes, com 6000 fotos para cada classe. O conjunto de dados é separado em cinco grupos de preparação e um grupo de teste, cada um com 10000 fotos. O conjunto de teste contém precisamente 1000 fotos escolhidas aleatoriamente de cada classe. Os grupos de preparação contêm o restante das figuras nos pedidos arbitrários, porém alguns grupos de preparação podem conter um número maior de figuras de uma classe do que de outra. Entre eles, os grupos de preparação contêm precisamente 5000 figuras de cada classe.

Aqui estão as classes no conjunto de dados, assim como 10 figuras irregulares de cada uma: São 50000 fotos preparadas e 10000 fotos de teste.

As aulas são totalmente alheias. Não há cobertura entre veículos e caminhões. O “carro” incorpora veículos, utilitários esportivos, coisas desse tipo. O “caminhão” incorpora apenas caminhões enormes. Tampouco incorpora caminhonetes.

Resultados dos Padrões

Você pode descobrir alguns resultados replicáveis de benchmark neste conjunto de dados na página de tarefas da cuda-convnet. Estes resultados foram obtidos com um sistema neural convolucional. Rapidamente, eles são 18% de erro de teste sem crescimento de informação e 11% com. Além disso, Jasper Snoek tem outro trabalho onde ele utilizou o avanço do hiperparâmetro Bayesiano para descobrir ajustes decentes do apodrecimento do peso e diferentes hiperparâmetros, o que lhe permitiu obter um erro de teste de 15% (sem aumento de informação) utilizando a engenharia da rede que obteve 18%.

Diferentes resultados

Rodrigo Benenson tem sido benevolente o suficiente para obter resultados no CIFAR-10/100 e diferentes conjuntos de dados em seu site; clique aqui para ver.

Projeto do conjunto de dados

Renovações Python/Matlab

Vou retratar o desenho da adaptação Python do conjunto de dados. O desenho da adaptação do Matlab é indistinguível.

A crônica contém os documentos data_batch_1, data_batch_2, …, data_batch_5, assim como o teste_batch. Cada um destes documentos é um objeto “curado” Python entregue com cPickle. Aqui está uma rotina python2 que abrirá tal registro e retornará uma referência de palavra:

desmarcar(arquivo):

    cPickle de importação

    com open(file, ‘rb’) como fo:

        dict = cPickle.load(fo)

    retorno

E uma versão python3:

desmarcar(arquivo):

    pickle de importação

    com open(file, ‘rb’) como fo:

        dict = pickle.load(fo, encoding=’bytes’)

    retorno

Empilhados ao longo destas linhas, cada um dos registros do grupo contém uma palavra de referência com os componentes que o acompanham:

informação – uma exposição numérica 10000×3072 de uint8s. Cada linha do cluster armazena uma imagem de sombreamento 32×32. As seções iniciais 1024 contêm a estima do canal vermelho, as seguintes 1024 o verde, e as últimas 1024 o azul. A imagem é guardada em push solicitação significativa, com o objetivo de que as 32 passagens iniciais da exposição sejam as estimativas do canal vermelho da coluna principal da imagem.

nomes – um resumo de 10000 números na faixa de 0-9. O número na lista I mostra a marca da i-ésima foto na informação da exposição.

Formulário duplo

O formulário duplo contém os documentos data_batch_1.bin, data_batch_2.bin, …, data_batch_5.bin, da mesma forma que test_batch.bin. Cada um destes documentos é projetado como perseguição:

<1 x etiqueta>>3072 x pixel>

<1 x etiqueta>>3072 x pixel>

No final do dia, o byte principal é o nome da imagem principal, que é um número na faixa de 0-9. Os 3072 bytes seguintes são as estimativas dos pixels da imagem. Os 1024 bytes iniciais são as estimações do canal vermelho, os 1024 seguintes o verde e os últimos 1024 o azul. As qualidades são colocadas de lado em pedidos significativos de push, então os 32 bytes iniciais são as estimativas do canal vermelho da linha primária da imagem.

Cada registro contém 10000 dessas “linhas” de 3073 bytes, apesar de não haver nada que delimite as linhas. Assim, cada registro deve ter, na verdade, 30730000 bytes de comprimento.

Há outro registro, chamado batches.meta.txt. Este é um registro ASCII que mapeia marcas numéricas na faixa de 0-9 para nomes de classes importantes. É apenas um rundown dos 10 nomes de classe, um para cada linha. O nome da classe no push I se relaciona com a marca numérica I.

O conjunto de dados CIFAR-100

Este conjunto de dados é muito parecido com o CIFAR-10, com exceção de 100 classes contendo 600 figuras cada. São 500 imagens de preparação e 100 imagens de teste para cada classe. As 100 classes do CIFAR-100 estão reunidas em 20 superclasses. Cada foto acompanha uma marca “fina” (a classe para a qual tem um lugar) e um nome “grosseiro” (a superclasse para a qual tem um lugar).

Aqui está o resumo das aulas no CIFAR-100:

Superclasses

mamíferos anfíbios castor , golfinho, lontra, foca, baleia

peixes de aquário , peixes chatos, vara, tubarão, truta

floresorquídeas , papoilas, rosas, girassóis, tulipas

recipientes de alimentação boiões , tigelas, potes, copos, pratos

produtos do solo, cogumelos, laranjas, peras, pimentas doces

unidade familiar aparelhos elétricos relógio , console de PC, luz, telefone, TV

móvel de unidade familiar cama , assento, assento amoroso, mesa, armário

abelha , escaravelho, borboleta, lagarta, barata

grande urso carnívoro , pantera, leão, tigre, lobo

enorme ponte de coisas feitas pelo homem ao ar livre , mansão, casa, rua, alta elevação

enormes e regulares cenas ao ar livre – nuvem , serra, planície, mar

enormes omnívoros e herbívoroscamel , bois, chimpanzé, elefante, canguru

mamíferos médios , porco-espinho, guaxinim, guaxinim, gambá

invertebrados invertebrados não-repreendentes , lagosta, caramujo, aracnídeo, minhoca

peoplebaby , kid, young lady, man, lady

reptilescrocodilo , dinossauro, réptil, cobra, tartaruga

pequeno mamífero , camundongo, lebre, mulher, esquiloeiro

árvoresmaple , carvalho, palma, pinheiro, salgueiro

veículos 1biciclo , transporte, cruzador, caminhonete, trem

veículos 2lawn-cutter , foguetão, bonde, tanque, trator