Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Der CIFAR-10-Datensatz besteht aus 60000 32×32 Schattierungsbildern in 10 Klassen mit 6000 Bildern für jede Klasse. Der Datensatz ist in fünf vorbereitende Büschel und ein Testbündel mit jeweils 10000 Bildern unterteilt. Das Testbündel enthält genau 1000 zufällig ausgewählte Bilder aus jeder Klasse. Die Präparationscluster enthalten den Rest der Bilder in den willkürlichen Anfragen, dennoch können einige Präparationsgruppen eine größere Anzahl von Bildern aus einer Klasse als aus einer anderen enthalten. Dazwischen enthalten die Vorbereitungsgruppen genau 5000 Bilder aus jeder Klasse.

Hier sind die Klassen im Datensatz, ebenso 10 unregelmäßige Bilder von jeder Klasse: Es gibt 50000 Vorbereitungsbilder und 10000 Testbilder.

Die Klassen sind grundsätzlich völlig beziehungslos. Es gibt keine Deckung zwischen Fahrzeugen und Lastwagen. Unter “Auto” sind Fahrzeuge, SUVs und dergleichen zu verstehen. “Lastwagen” umfasst einfach riesige Lastwagen. Auch Pickup-Lastwagen gehören nicht dazu.

Muster-Ergebnisse

Auf der Aufgabenseite von cuda-convnet finden Sie einige Benchmark-Ergebnisse, die auf diesen Datensatz replizierbar sind. Diese Ergebnisse wurden mit einem gefalteten neuronalen System erhalten. Schnell sind es 18% Testfehler ohne Informationszuwachs und 11% mit. Darüber hinaus hat Jasper Snoek eine weitere Arbeit, in der er die Bayes’sche Hyperparameterentwicklung nutzte, um anständige Einstellungen der Gewichtsfäule und verschiedene Hyperparameter zu entdecken, die es ihm ermöglichten, eine Testfehlerrate von 15% (ohne Informationszuwachs) zu erhalten, indem er die Technik des Netzes nutzte, die 18% erreichte.

Unterschiedliche Ergebnisse

Rodrigo Benenson war so wohlwollend, Ergebnisse zu CIFAR-10/100 und verschiedenen Datensätzen auf seiner Website zu sammeln; klicken Sie hier, um zu sehen.

Entwurf eines Datensatzes

Python/Matlab-Wiedergaben

Ich werde das Design der Python-Anpassung des Datensatzes darstellen. Das Design der Matlab-Anpassung ist nicht unterscheidbar.

Die Chronik enthält die Dokumente data_batch_1, data_batch_2, …, data_batch_5, ebenso wie test_batch. Jedes dieser Dokumente ist ein Python-“gehärtetes” Objekt, das mit cPickle ausgeliefert wird. Hier ist eine Python2-Routine, die einen solchen Datensatz öffnet und eine Wortreferenz zurückgibt:

def unpickle(Datei):

    importieren cPickle

    mit open(Datei, ‘rb’) als fo:

        dict = cPickle.load(fo)

    Rückkehr-Diktat

Und eine Python3-Version:

def unpickle(Datei):

    Import-Beize

    mit open(Datei, ‘rb’) als fo:

        dict = pickle.load(fo, Kodierung=’Bytes’)

    Rückkehr-Diktat

Auf diese Weise gestapelt, enthält jeder der Bündelsätze einen Wortbezug mit den dazugehörigen Bestandteilen:

Informationen – ein 10000×3072 numpy Exponat von uint8s. Jede Zeile des Clusters speichert ein 32×32 Schattierungsbild. Die ersten 1024 Abschnitte enthalten die roten Kanalschätzungen, die folgenden 1024 die grünen und die letzten 1024 die blauen. Das Bild wird in push significant request abgelegt, mit dem Ziel, dass die anfänglichen 32 Passagen des Exponats die Rotkanalschätzungen der Hauptspalte des Bildes sind.

Namen – eine Auflistung von 10000 Nummern im Bereich 0-9. Die Nummer in Liste I zeigt die Markierung des i-ten Bildes in den Ausstellungsinformationen.

Doppelte Form

Das Doppelformular enthält die Dokumente data_batch_1.bin, data_batch_2.bin, …, data_batch_5.bin, ebenso wie test_batch.bin. Jedes dieser Dokumente ist als Verfolgungsdokument konzipiert:

<1 x Etikett><3072 x Pixel>

<1 x Etikett><3072 x Pixel>

Am Ende des Tages ist das Hauptbyte der Name des Hauptbildes, das eine Zahl im Bereich 0-9 ist. Die folgenden 3072 Bytes sind die Schätzungen der Pixel des Bildes. Die anfänglichen 1024 Bytes sind die Schätzwerte für den roten Kanal, die folgenden 1024 Bytes sind die grünen und die letzten 1024 Bytes sind die blauen. Die Qualitäten werden in Push-Signifikant-Anfragen weggelegt, so dass die anfänglichen 32 Bytes die Rotkanalschätzungen der Primärzeile des Bildes sind.

Jeder Datensatz enthält 10000 solcher 3073-Byte-“Zeilen” von Bildern, obwohl es nichts gibt, was die Zeilen abgrenzt. Auf diese Weise müsste jeder Satz eigentlich 30730000 Bytes lang sein.

Es gibt einen weiteren Datensatz mit der Bezeichnung batchches.meta.txt. Dies ist ein ASCII-Datensatz, der numerische Markierungen im Bereich 0-9 wichtigen Klassennamen zuordnet. Es handelt sich lediglich um eine Auflistung der 10 Klassennamen, einen für jede Zeile. Der Klassenname auf Druck I bezieht sich auf die numerische Markierung I.

Der CIFAR-100-Datensatz

Dieser Datensatz entspricht weitgehend dem CIFAR-10-Datensatz, mit Ausnahme von 100 Klassen mit jeweils 600 Bildern. Es gibt 500 Vorbereitungsbilder und 100 Testbilder für jede Klasse. Die 100 Klassen im CIFAR-100 sind in 20 Superklassen zusammengefasst. Jedes Bild ist mit einer “feinen” Note (die Klasse, zu der es gehört) und einem “groben” Namen (die Oberklasse, zu der es gehört) versehen.

Hier ist eine Übersicht über die Klassen in CIFAR-100:

OberklasseKlassen

amphibische SäugetiereBiber , Delphin, Otter, Robbe, Wal

Fischaquarienfische, Plattfische, Balken, Haie, Forellen

Blumenorchideen , Mohn, Rosen, Sonnenblumen, Tulpen

LebensmittelbehälterFlaschen , Schalen, Gläser, Tassen, Teller

Erzeugnisse des Bodens, Pilze, Orangen, Birnen, Gemüsepaprika

Familieneinheit elektrische GeräteUhr , PC-Konsole, Licht, Telefon, TV

Familieneinheit Möbelbett , Sitz, Liebessitz, Tisch, Schrank

Insektenbiene , Skarabäus, Schmetterling, Raupe, Kakerlake

riesiger Fleischfresser-Bär , Panther, Löwe, Tiger, Wolf

riesige von Menschenhand geschaffene Freiluft-Dingerbrücke , Herrenhaus, Haus, Straße, Hochhaus

riesige regelmäßige Open-Air-Szenen Wolke , Hinterwälder, Berg, Ebene, Ozean

riesige Allesfresser und PflanzenfresserKamel , Ochsen, Schimpanse, Elefant, Känguru

mittelgroße Säugetiere: Fuchs , Stachelschwein, Opossum, Waschbär, Stinktier

nicht-kriechende wirbellose KriechtiereKrebs , Hummer, Schnecke, Spinnentiere, Wurm

LeuteBaby , Kind, junge Dame, Mann, Dame

ReptilienKrokodil , Dinosaurier, Reptil, Schlange, Schildkröte

kleines Säugetier , Maus, Hase, Weibchen, Eichhörnchen

Bäume Ahorn , Eiche, Palme, Kiefer, Weide

Fahrzeuge 1Fahrrad , Transport, Cruiser, Pickup, Zug

Fahrzeuge 2Rasenmäher , Rakete, Straßenbahn, Panzer, Traktor

Languages

Weekly newsletter

No spam. Just the latest releases and tips, interesting articles, and exclusive interviews in your inbox every week.