il database MNIST (Changed National Organization of Benchmarks and Innovation database) è un enorme database di cifre scritte manualmente che viene normalmente utilizzato per la preparazione di diversi sistemi di gestione delle immagini. Il database è inoltre generalmente utilizzato per la preparazione e il collaudo nel campo dell’apprendimento delle macchine. È stato realizzato “mescolando” gli esempi degli insiemi di dati unici del NIST. I creatori hanno ritenuto che, poiché il dataset di preparazione del NIST è stato preso da rappresentanti dell’American Statistics Agency, mentre il dataset di test è stato preso da sostituti delle scuole secondarie americane, non era appropriato per gli esperimenti di IA. Inoltre, le immagini altamente contrastanti del NIST sono state standardizzate per adattarsi ad una scatola di delimitazione di 28×28 pixel e ostili agli associati, che presentavano livelli di scala di grigi.

Immagini del test MNIST

Immagini di prova dal dataset di prova MNIST

Il database MNIST contiene 60.000 immagini di preparazione e 10.000 immagini di prova. Metà del set di preparazione e metà del set di test sono state prese dal dataset di preparazione del NIST, mentre l’altra parte del set di preparazione e l’altra parte del set di test sono state prese dal dataset di prova del NIST. Ci sono stati vari documenti logici sui tentativi di realizzare il tasso di errore più ridotto; un documento, utilizzando una disposizione progressiva dei sistemi neurali convoluzionali, ha capito come ottenere un tasso di errore sul database del MNIST dello 0,23%. I primi creatori del database tengono un resoconto di una parte delle tecniche provate[5] Nel loro unico documento, utilizzano una macchina vettoriale di aiuto per ottenere un tasso di errore dello 0,8%. Nel 2017 è stato distribuito un set di dati completo come MNIST chiamato EMNIST, che contiene 240.000 immagini di preparazione e 40.000 immagini di prova di cifre e caratteri scritti manualmente.

Esecuzione

Alcuni analisti hanno realizzato una “esecuzione umana ravvicinata” sul database del MNIST, utilizzando una commissione di amministratori di sistemi neurali; in un documento simile, i creatori compiono un’esecuzione doppia rispetto a quella delle persone su altri compiti di riconoscimento. Il tasso di errore più degno di nota elencato sul primo sito del database è del 12%, che viene realizzato utilizzando un semplice classificatore diretto senza preelaborazione.

Nel 2004, nel migliore dei casi, un errore dello 0,42% è stato commesso sul database dagli analisti che hanno utilizzato un altro classificatore chiamato LIRA, che è un classificatore neurale con tre strati neuronali che dipendono dai principi del percotrone di Rosenblatt.

Alcuni scienziati hanno provato a creare strutture di brainpower artificiali utilizzando il database messo sotto contorsioni arbitrarie. Le strutture in questi casi sono tipicamente sistemi neurali e le mutilazioni utilizzate saranno, in generale, o contorsioni relative o distorsioni versatili. Di tanto in tanto, questi framework possono essere fruttuosi; uno di questi framework ha raggiunto un tasso di errore sul database dello 0,39 per cento.

Nel 2011, un tasso di errore dello 0,27%, che migliora i risultati migliori del passato, è stato registrato dagli analisti che hanno utilizzato una disposizione comparativa delle reti neurali. Nel 2013, una metodologia dipendente dalla regolarizzazione dei sistemi neurali che utilizzano DropConnect è stata professata per ottenere un tasso di errore dello 0,21%.[14] Recentemente,[quando?] la migliore esecuzione del singolo sistema neurale convoluzionale è stata dello 0,31%.[15] Ad agosto 2018, la migliore esecuzione di un sistema neurale convoluzionale solitario preparato su MNIST che prepara le informazioni utilizzando la crescita delle informazioni in tempo reale è pari a 0.Analogamente, il Parallel Registering Center (Khmelnitskiy, Ucraina) ha acquisito un equipaggiamento di soli 5 sistemi neurali convoluzionali che funziona su MNIST a un tasso di errore dello 0,21%.

Questa è una tabella di alcuni dei metodi di machine learning utilizzati sul database e dei loro tassi di errore, per tipo di classificatore:

TipoClassificatoreDistorsionePretrattamentoTasso di errore (%)
Classificatore lineareClassificatore lineare a coppieNessunoDeskewing7.6[9]
K-Nearest NeighborsK-NN con deformazione non lineare (P2DHMDM)NessunoBordi spostabili0.52[19]
Ceppi potenziatiProdotto di monconi su Haar caratteristicheNessunoCaratteristiche Haar0.87[20]
Classificatore non lineare40 PCA + classificatore quadraticoNessunoNessuno3.3[9]
Macchina di supporto vettoriale (SVM)SVM virtuale, deg-9 poli, 2 pixel jitteratiNessunoDeskewing0.56[21]
Rete neurale profonda (DNN)2 strati 784-800-10NessunoNessuno1.6[22]
Rete neurale profonda2 strati 784-800-10Distorsioni elasticheNessuno0.7[22]
Rete neurale profonda6 strati 784-2500-2000-1500-1000-500-10Distorsioni elasticheNessuno0.35[23]
Rete neurale convoluzionale (CNN)6 strati 784-40-80-500-1000-2000-10NessunoAmpliamento dei dati di formazione0.31[15]
Rete neurale convoluzionale6 strati 784-50-100-500-1000-10-10NessunoAmpliamento dei dati di formazione0.27[24]
Rete neurale convoluzionaleComitato di 35 CNN, 1-20-P-40-P-150-10Distorsioni elasticheNormalizzazione della larghezza0.23[8]
Rete neurale convoluzionaleComitato di 5 CNN, 6 strati 784-50-100-500-1000-10-10NessunoAmpliamento dei dati di formazione0.21[17][18]