El conjunto de datos de CIFAR-10 comprende 60000 imágenes de sombreado de 32×32 en 10 clases, con 6000 imágenes para cada clase. El conjunto de datos está separado en cinco grupos de preparación y un grupo de prueba, cada uno con 10000 imágenes. El grupo de prueba contiene precisamente 1000 imágenes escogidas al azar de cada clase. Los grupos de preparación contienen el resto de las imágenes en las solicitudes arbitrarias, pero algunos grupos de preparación pueden contener un mayor número de imágenes de una clase que otra. Entre ellos, los grupos de preparación contienen precisamente 5000 imágenes de cada clase.

Aquí están las clases en el conjunto de datos, al igual que 10 imágenes irregulares de cada una: Hay 50000 fotos de preparación y 10000 fotos de prueba.

Las clases no están relacionadas en lo fundamental. No hay cobertura entre los vehículos y los camiones. “Coche” incorpora vehículos, SUVs, cosas de ese tipo. “Camión” incorpora sólo camiones enormes. Tampoco incorpora camionetas.

Resultados de los patrones

Puede descubrir algunos resultados reproducibles de referencia en este conjunto de datos en la página de tareas de cuda-convnet. Estos resultados se obtuvieron con un sistema neural convolucional. Rápidamente, son un 18% de error de prueba sin crecimiento de información y un 11% con. Además, Jasper Snoek tiene otro trabajo en el que utilizó el avance de los hiperparámetros bayesianos para descubrir configuraciones decentes de la putrefacción del peso y diferentes hiperparámetros, lo que le permitió obtener un ritmo de error de prueba del 15% (sin aumento de información) utilizando la ingeniería de la red que obtuvo un 18%.

Diferentes resultados

Rodrigo Benenson ha sido lo suficientemente benévolo como para reunir los resultados de CIFAR-10/100 y diferentes conjuntos de datos en su sitio; haga clic aquí para ver.

Diseño del conjunto de datos

Rendiciones de pitón/matlab

Describiré el diseño de la adaptación a la Pitón del conjunto de datos. El diseño de la adaptación a Matlab es indistinguible.

La crónica contiene los documentos data_batch_1, data_batch_2, …, data_batch_5, así como test_batch. Cada uno de estos documentos es un objeto “curado” de Python entregado con cPickle. Aquí hay una rutina de python2 que abrirá tal registro y devolverá una referencia de palabra:

def unpickle(file):

    importar cPickle

    con open(file, ‘rb’) como fo:

        dict = cPickle.load(fo)

    el dictador de la vuelta

Y una versión de pitón3:

def unpickle(file):

    importar pepinillos

    con open(file, ‘rb’) como fo:

        dict = pepinillo.load(fo, encoding=’bytes’)

    el dictador de la vuelta

Apilados de esta manera, cada uno de los registros del grupo contiene una palabra de referencia con los componentes que lo acompañan:

información – una exhibición numérica de 10000×3072 de uint8s. Cada línea del cúmulo almacena una imagen de sombreado de 32×32. Las secciones iniciales de 1024 contienen las estimaciones del canal rojo, las siguientes 1024 el verde, y las últimas 1024 el azul. La imagen se guarda en la solicitud de empuje significativo, con el objetivo de que los 32 pasajes iniciales de la exposición sean las estimaciones de canal rojo de la columna principal de la imagen.

nombres – un resumen de 10.000 números en el rango de 0 a 9. El número de la lista I muestra la marca de la imagen i en la información de la exposición.

Doble forma

El doble formulario contiene los documentos data_batch_1.bin, data_batch_2.bin, …, data_batch_5.bin, al igual que test_batch.bin. Cada uno de estos documentos se diseña según los objetivos:

<1 x etiqueta>>3072 x pixel>

<1 x etiqueta>>3072 x pixel>

Al final del día, el byte principal es el nombre de la imagen principal, que es un número en el rango 0-9. Los siguientes 3072 bytes son las estimaciones de los píxeles de la imagen. Los 1024 bytes iniciales son las estimaciones de los canales rojos, los siguientes 1024 los verdes, y los últimos 1024 los azules. Las calidades se guardan en las peticiones de empuje significativas, así que los 32 bytes iniciales son las estimaciones del canal rojo de la línea primaria de la imagen.

Cada registro contiene 10000 de esas “líneas” de 3073 bytes de imágenes, a pesar de que no hay nada que delimite las líneas. De esta manera cada registro debería tener una longitud de 30730000 bytes.

Hay otro registro, llamado batches.meta.txt. Este es un registro ASCII que asigna marcas numéricas en el rango 0-9 a nombres de clases importantes. Es sólo un resumen de los 10 nombres de clase, uno por cada línea. El nombre de la clase en “push I” se relaciona con la marca numérica I.

El conjunto de datos del CIFAR-100

Este conjunto de datos es muy parecido al CIFAR-10, con la excepción de que tiene 100 clases que contienen 600 imágenes cada una. Hay 500 imágenes de preparación y 100 imágenes de prueba para cada clase. Las 100 clases del CIFAR-100 están reunidas en 20 superclases. Cada imagen acompaña una marca “fina” (la clase en la que tiene un lugar) y un nombre “grueso” (la superclase en la que tiene un lugar).

Aquí está el resumen de las clases en el CIFAR-100:

Superclases

anfibio , delfín, nutria, foca, ballena

pez de acuario , pez plano, rayo, tiburón, trucha

flores-orquídeas , amapolas, rosas, girasoles, tulipanes

contenedores de alimento – botellas , tazones, jarras, tazas, platos

productos de la tierra, setas, naranjas, peras, pimientos dulces

unidad familiar dispositivos eléctricosreloj , consola de PC, luz, teléfono, TV

unidad familiar: cama , asiento, love-seat, mesa, armario.

abeja, escarabajo, mariposa, oruga, cucaracha

enorme oso carnívoro , pantera, león, tigre, lobo

enormes cosas al aire libre hechas por el hombre: puente , casa, calle, rascacielos…

enormes escenas regulares al aire libre , nubes , bosques, montañas, llanuras, océanos.

enormes omnívoros y herbívoros camello , novillo, chimpancé, elefante, canguro

mamíferos de tamaño mediano – zorro, puerco espín , zarigüeya, mapache, mofeta

invertebrados no espeluznantes cangrejo , langosta, caracol, arácnido, gusano

peoplebaby , chico, joven, hombre, mujer

reptilescrocodilo , dinosaurio, reptil, serpiente, tortuga

pequeño mamífero , ratón, liebre, moza, ardilla…

árbol , roble, palma, pino, sauce

vehículos 1bicycle , transporte, crucero, camioneta, tren

vehículos 2 cortadora de césped , cohete, tranvía, tanque, tractor