Набор данных CIFAR-10 состоит из 60000 32×32 затеняющих изображений в 10 классах, по 6000 изображений для каждого класса. Набор данных разделен на пять подготавливающих кусков и одну тестовую группу, каждая из которых содержит 10000 фотографий. Тестовая группа содержит ровно 1000 беспорядочно выбранных снимков для каждого класса. Кластеры подготовки содержат остальные картинки в произвольных запросах, однако некоторые группы подготовки могут содержать больше картинок из одного класса, чем из другого. Между ними группы подготовки содержат ровно 5000 картинок из каждого класса.

Вот классы в наборе данных, как и 10 картинок с произвольными запросами от каждого из них: 50000 подготовительных и 10000 пробных.

Классы совершенно не связаны между собой. Среди транспортных средств и грузовиков нет прикрытия. “Автомобиль” включает в себя автомобили, внедорожники, все такое. “Грузовик” включает только огромные грузовики. Ни то, ни другое не включает пикапы.

Результаты моделирования

Вы можете обнаружить некоторые эталонные реплицируемые результаты в этом наборе данных на странице задач для cuda-convnet. Эти результаты были получены с помощью конволюционной нейронной системы. Быстро, они являются 18% ошибкой теста без роста информации и 11% с. Более того, у Джаспера Снука есть еще одна работа, в которой он использовал байесовский гиперпараметрический прогресс, чтобы обнаружить приличные настройки веса гнили и различные гиперпараметры, что позволило ему получить тест с ошибкой в 15% (без увеличения информации), используя инжиниринг сети, которая получила 18%.

Различные результаты

Родриго Бененсон был достаточно доброжелателен, чтобы собрать результаты по CIFAR-10/100 и различным наборам данных на своем сайте; нажмите здесь, чтобы увидеть.

Дизайн наборов данных

переводы на питон/матлаб

Я изображу дизайн Python-адаптации набора данных. Дизайн адаптации Матлаба неразличим.

Хроника содержит документы data_batch_1, data_batch_2, …, data_batch_5, так же как и test_batch. Каждый из этих документов – это “вылеченный” объект Python, поставляемый вместе с cPickle. Вот рутина python2, которая откроет такую запись и вернет ссылку на слово:

def unpickle(file):

импорт cPickle

с open(file, ‘rb’) в качестве fo:

dict = cPickle.load(fo)

принцип возврата

И версия с питоном 3:

def unickle(file):

импортный маринад

с open(file, ‘rb’) в качестве fo:

dict = pickle.load(fo, encoding=’bytes’)

принцип возврата

Сложенные по этим строкам, каждая из связок записей содержит ссылку на слово с сопроводительными компонентами:

информация – номерной экспонат uint8s 10000×3072. В каждой строке кластера хранится затеняющее изображение 32×32. Первоначальные 1024 секции содержат красный канал, следующие 1024 – зеленый, а последние 1024 – синий. Картинка отбрасывается в push significant request, с целью, чтобы начальные 32 прохода экспозиции были оценками красного канала основного столбца картинки.

имена – сводка 10000 чисел в диапазоне 0-9. Цифра в списке I показывает отметку этой картинки в информации об экспозиции.

Двойная форма

Двойная форма содержит документы data_batch_1.bin, data_batch_2.bin, …, data_batch_5.bin, так же как и test_batch.bin. Каждый из этих документов разработан в соответствии с задачами:

<1 х метка><3072 х пиксел>.

<1 x label><3072 x pixel>

В конце дня основным байтом является название основного изображения, которое представляет собой число в диапазоне 0-9. Следующие 3072 байта являются оценками пикселей изображения. Начальные 1024 байта – это оценки красного канала, следующие 1024 – зеленого, а последние 1024 – синего. Качества отбрасываются в push significant requests, поэтому начальные 32 байта – это оценки красного канала первичной линии картинки.

Каждая запись содержит 10000 таких 3073-байтных “линий” картинок, несмотря на то, что ничто не делит линии. Таким образом, каждая запись должна быть на самом деле 30730000 байт.

Есть еще одна запись, называемая batches.meta.txt. Это ASCII запись, которая сопоставляет числовые метки в диапазоне 0-9 важным именам классов. Это всего лишь краткое перечисление 10 имен классов, по одному на каждую строку. Имя класса при нажатии I относится к числовому знаку I.

Набор данных CIFAR-100

Этот набор данных во многом похож на CIFAR-10, за исключением того, что он имеет 100 классов, содержащих 600 изображений каждый. Для каждого класса имеется 500 готовых изображений и 100 тестовых изображений. 100 классов в CIFAR-100 собраны в 20 суперклассов. Каждая картинка сопровождается “отличием” (класс, в котором она имеет место) и “грубым” названием (суперкласс, в котором она имеет место).

Вот краткое описание классов в CIFAR-100:

Суперклассы Классы

млекопитающие-амфибии бобр, дельфин, выдра, тюлень, кит

аквариумные рыбки, камбала, бревно, акула, форель

цветы орхидеи, мак, розы, подсолнухи, тюльпаны

питательные контейнеры бутылки, миски, банки, чашки, тарелки

продукты из почвы, грибы, апельсины, груши, сладкий перец

семейный блок электрических устройств часы, консоль ПК, свет, телефон, телевизор

семейная единица мебель кровать, сиденье, любовь сиденье, стол, шкаф

насекомые пчелы, скарабея, бабочки, гусеницы, тараканы

огромные плотоядные медведь, пантера, лев, тигр, волк

огромный рукотворный мост вещей под открытым небом, усадьба, дом, улица, высотка.

огромные регулярные пейзажи под открытым небом облака, глухой лес, горы, равнина, океан.

огромные всеядные и травоядные верблюды, бычки, шимпанзе, слоны, кенгуру

средние млекопитающие лиса, дикобраз, опоссум, енот, скунс

нежелудочно-крабские беспозвоночные крабы, омары, улитки, арахниды, черви.

люди детка, детка, юная леди, мужик, леди…

рептилии крокодил, динозавр, рептилия, змея, черепаха

маленькие млекопитающие хомячок, мышь, заяц, девчонка, белка

клен, дуб, пальма, сосна, ива

транспортные средства 1 велосипед, транспорт, крейсер, пикап, поезд

машины 2 газонокосилки, ракеты, трамваи, танки, трактора