Poiché i set di dati aumentano drasticamente, stiamo sviluppando competenze per migliorare il modo in cui addestriamo le reti neurali profonde. Questo aiuta gli scienziati dei dati a mappare gli input e gli output mentre etichettano enormi quantità di dati. Questi dati includono previsioni di etichette, frasi, immagini, ecc.
Non siamo ancora in grado di generalizzare le differenze tra le condizioni che aiutano ad addestrare i dati. Permettere al modello di eseguire tali attività nel mondo reale può essere un compito arduo. Poiché ci sono numerose situazioni nuove e disordinate, il modello incontrerà i problemi per i quali i dati di addestramento non sono pronti.
L’algoritmo ha bisogno di fare nuove previsioni per risolvere situazioni complicate e reali. In questo articolo, discuteremo come trasferire i dati alle nuove condizioni. Questo blog capirà come i modelli possono adottare l’apprendimento per trasferimento e sviluppare un modello di apprendimento supervisionato esteso e di successo.
Comprendere l’apprendimento per trasferimento
Il transfer learning non è un nuovo approccio nell’apprendimento profondo. Anche se è diverso dal metodo tradizionale di creare e addestrare modelli di apprendimento automatico per seguire un metodo di trasferimento dei dati, ci sono numerose somiglianze. Le radici principali dei metodi tradizionali sono specifiche per l’addestramento, i set di dati e i compiti basati su modelli isolati.
Il modello non include alcuna conoscenza che conserva da altri modelli. Quando si tratta di trasferire l’apprendimento, è possibile controllare i set di dati di allenamento nei nuovi modelli e gestire problemi come l’esecuzione di nuovi compiti con meno dati.
Potete capire questo approccio con un esempio. Supponiamo di voler identificare diversi oggetti in un dominio ristretto di una società di e-commerce. Supponiamo di eseguire il compito 1 come T1. Si fornirà quindi il modello di vari set di dati e lo si sintonizzerà per eseguire punti di dati non visti dallo stesso punto di dati o dominio dell’e-commerce.
L’algoritmo di apprendimento automatico tradizionale interrompe i compiti nei domini dati se i dati non sono sufficienti. Diciamo che il modello rileva alcune immagini di articoli di abbigliamento per un sito web di e-commerce. Questo può essere il compito 2 o T2. Idealmente, si dovrebbe essere in grado di utilizzare il dataset o le immagini di un modello addestrato T1 per un altro T2. Ma non incontriamo una situazione simile e non riusciamo a migliorare le prestazioni del modello. Questo ha molti scopi, come ad esempio influenzare il modello per addestrare il dominio.
Con l’apprendimento di trasferimento, dovremmo essere in grado di usare i dati di un modello addestrato per nuovi modelli correlati. Se abbiamo più dati nel compito T1, possiamo utilizzare la conoscenza come il colore e la taglia della camicia al modello che ha meno conoscenza, cioè T2. Quando c’è un problema nel dominio della computer vision, è possibile trasferire le caratteristiche a diversi compiti e migliorare la conoscenza. In parole povere, si può usare la conoscenza di un compito come input dell’altro per eseguire nuovi compiti.
Strategie di apprendimento per trasferimento
L’apprendimento per trasferimento ha numerose tecniche e strategie di apprendimento, che potete applicare ai vostri progetti a seconda del dominio, dei dati disponibili e dei compiti. Di seguito troverete alcune di queste strategie e tecniche:
1. Apprendimento di trasferimento non supervisionato
Il dominio di destinazione e le fonti sono simili, mentre i compiti e le attività sono diversi. In questo caso, i dati etichettati non sono disponibili in nessun dominio. Le tecniche induttive e non supervisionate sono simili per il dominio di destinazione.
2. Apprendimento di trasferimento trasduttivo
In questa condizione, le attività di destinazione e di origine sono simili, ma ci sono differenze nei domini correlati. Ci sono molti dati etichettati nel dominio di origine, mentre non ci sono dati nel dominio di destinazione. Si può classificare in diverse sottocategorie, facendo riferimento a impostazioni dissimili.
3. Apprendimento induttivo di trasferimento
I domini di destinazione e di origine sono gli stessi, ma entrambi i loro compiti sono diversi. Gli algoritmi utilizzano i pregiudizi induttivi del dominio di origine e aiutano a migliorare il compito di destinazione. È possibile dividere i dati etichettati in due categorie apprendimento autodidattico e apprendimento multitask.
Apprendimento di trasferimento per l’apprendimento profondo
Tutte le strategie di cui sopra sono approcci generali che possiamo applicare nel modello di apprendimento automatico. Questo solleva varie domande, come “possiamo applicare il transfer learning nel contesto dell’apprendimento profondo? I modelli di apprendimento profondo aiutano i modelli di apprendimento induttivo. Un algoritmo di apprendimento induttivo può aiutare nella mappatura degli esempi di formazione.
Per esempio, il modello imparerà la mappatura classificando le etichette di classe e le caratteristiche di input. Questi tipi di modelli di apprendimento generalizzano i dati non visti. Inoltre, l’algoritmo lavorerà secondo i presupposti, a seconda della distribuzione dei dati di formazione.
Gli esperti chiamano questi presupposti bias induttivi. Con l’aiuto delle ipotesi induttive o bias, è possibile caratterizzare più fattori. Per esempio, lo spazio di ipotesi limita il processo di ricerca, e avrà un grande impatto sul processo di apprendimento del modello basato su un dato dominio e compito.
Conclusione
Per concludere, possiamo dire che numerose direzioni di ricerca stanno trasferendo le offerte di apprendimento. Molte applicazioni che aiutano a trasferire la conoscenza hanno bisogno di modelli per adottare nuovi compiti nei nuovi domini.