Essendo le cose come sono, la decisione normale è quella di arruolare un gruppo di ricercatori dell’informazione per costruire il tuo pensiero, giusto?

Tutto sommato, non proprio.

I ricercatori di dati, di norma, hanno origine da una base inaspettata rispetto agli ingegneri di programmazione. Non sono davvero degli incredibili ingegneri del software. Anzi, non si sarebbero mai aspettati di essere loro – per un ricercatore di informazioni la codifica è semplicemente un modo per illuminare la perplessità di flusso e riflusso. Inoltre, questo è tutto. Non sono affatto come i progettisti di programmazione, non considerano il codice come un tipo di artigianato. Ovviamente, la loro astuzia non ha prezzo, tuttavia la portata delle capacità richieste per essere un ricercatore d’informazione efficace è ormai ampia (in particolare quando il campo avanza per la maggior parte del tempo con le nuove rivelazioni, rendendo regolarmente obsoleto un enorme segmento di dati guadagnati con fatica). Troppo ampio. Non è possibile anticipare da un individuo che è eccezionalmente lavorato in visione PC o esame prescrittivo di essere inoltre pane e burro ingegnere del software, la produzione dei modelli e la loro messa in condizioni di cloud travolgente adattabile. Mantenendo allo stesso tempo un codice di prima qualità e riutilizzabile. Utilizzando una programmazione utile. Oppure, ancora una volta, ricettivo. O d’altra parte entrambi.

Anche in questo caso, gli architetti della programmazione sono molto legati all’IA. L’intera idea è abbastanza peculiare dal loro punto di vista, soprattutto quando la maggior parte dei presunti modelli che il loro gruppo di scienza dell’informazione realizza sono brevi, contenuti hacky con chiamate strategiche anomale e codice disarticolato in un nuovo dialetto. Dove sono tutti i disegni della struttura? Dov’è il codice perfetto? Dove si trova la registrazione o l’osservazione? Per quale motivo il codice non è riutilizzabile? Il codice che si occupa di un problema così imprevedibile non dovrebbe superare le 200 righe? È un contenuto spaventoso che può essere ottenuto solo da un singolo individuo! In ogni caso, la programmazione è più lunga?

La fusione

Con l’emergere di questa contesa è stata concepita una necessità. Un’esigenza per un individuo che si ricongiungesse a due parti in guerra. Una che fosse abbastanza familiare solo nei due campi per rendere l’oggetto pienamente operativo. Qualcuno che prendesse il codice dei ricercatori dell’informazione e lo rendesse sempre più convincente e versatile. Conoscere le diverse regole di programmazione e le grandi pratiche. Astraendo incessantemente parti di codice che potrebbero essere utilizzate in futuro. Unendo i risultati di incarichi forse irrilevanti per migliorare notevolmente l’esecuzione del modello. Chiarire le spiegazioni per i pensieri compositivi al gruppo di sviluppo. Salvare gli ingegneri di programmazione dal percorso di apprendimento delle idee oltre la loro portata di premi.

Questa esigenza è stata soddisfatta con un aumento dei posti di lavoro di ingegnere AI.

Ciò che è continuamente assente in ogni articolo, esercizio didattico e libro che riguarda la ML è la condizione di generazione. Davvero non esiste. Le informazioni sono impilate da CSV, i modelli sono realizzati in Jupyter, le curve ROC sono disegnate e voilà – il tuo articolo di IA è pronto per l’azione. È il momento di un altro giro di sovvenzionamento dei semi!

In realtà, la maggior parte del vostro codice non è collegato all’IA. A dire il vero, il codice rispetto ad esso richiede generalmente solo un paio di percento del vostro intero codice! La vostra scoperta addestrata offre solo la risposta minore di JSON – ci sono un numero enorme di linee di codice necessarie per dare seguito a questa aspettativa. Oppure, d’altra parte, forse tutto ciò che si ottiene è una tabella di database creata con bit di conoscenza. Ancora una volta, un intero framework dovrebbe basarsi su di esso per renderlo utile! È necessario ottenere le informazioni, modificarle e sgranocchiarle, robotizzare i vostri impieghi, presentare i bit di conoscenza da qualche parte al cliente finale. Indipendentemente da quanto poco sia il problema, la misura del lavoro da fare intorno all’IA stessa è enorme, a prescindere dal fatto che si inizi la vostra impresa con i progressi, per esempio, Apache Wind current o NiFi.

Tuttavia, qualcuno deve attenersi a tutte le parti “scienza dell’informazione” e “programmazione” insieme. Prendete il modello preparato e fategli fare una prova della condizione di generazione della qualità. Occupazioni a ciuffi di orari ricalcolando le tabelle di conoscenza. Servire il modello progressivamente e schermarne la presentazione in natura. Inoltre, questa è la zona definita in cui l’ingegnere AI scintilla.

Durante la programmazione, gli ingegneri sono normalmente alla ricerca di tutti i potenziali risultati in tutti gli aspetti dell’utilizzo. Ciò che si ottiene da un ricercatore di informazioni è solo un modo ottimistico che richiede la creazione di modelli per le informazioni specifiche al minuto specifico. Tranne se si tratta di un’indagine esplicita una tantum, il modello vivrà per un bel po’ di tempo dopo la sua produzione. Inoltre, man mano che il tempo passa velocemente, i bug e tutti i casi limite spuntano fuori (molti di essi non erano in alcun modo concepibili quando il codice è stato composto). All’improvviso un altro oscuro valore appare in una delle sezioni e l’intero modello inizia a funzionare in modo molto più spiacevole.

In qualità di ingegnere di intelligenza artificiale, voi preparate le vostre applicazioni per queste occasioni. Voi date la registrazione e l’osservazione delle condutture intorno alle commissioni di IA, così come all’interno di esse. Si cerca di proteggere tutti i dati in modo che sia possibile rispondere a richieste significative: Qual è il motivo della presentazione del terribile modello? Da quando si verifica?

Si tratta semplicemente di un’interfaccia di programmazione in più

Poiché non si considera ML come un incanto, si conoscono tutti gli altri normali pericoli di programmazione che possono emergere quando un lavoro di IA viene eseguito. Il database può rifiutare l’associazione. GroupBy può esplodere per un enorme set di dati. La memoria o il cerchio può essere pieno. Un mix di parametri indicati dal cliente può essere illegale per certi calcoli. L’assistenza esterna potrebbe reagire con Break Exemption piuttosto che con gli accreditamenti. Una sezione potrebbe non esistere più. Anche se nessuno strizza gli occhi quando tali occasioni si verificano regolarmente in condizioni di laboratorio protetto, è vostro dovere garantire che non si verifichino quando il risultato finale viene realmente trasmesso.

Il vostro gruppo di scienze dell’informazione è in ogni caso carico di pensieri. Dovete fare in modo che nessuna innovazione li limiti. Per quanto grandi e regolabili siano le attuali strutture ML, ad un certo punto o ad un altro i vostri partner avranno un accattivante caso d’uso che non è fattibile con nessuno di loro. Tutto sommato, non con le API standard. Tuttavia, quando vi immergerete nei loro interni, li cambierete un po’ e vi mescolerete in un’altra libreria o due, lo renderete possibile. Si abusa delle strutture e le si utilizza al massimo della loro capacità. Ciò richiede sia ampie programmazioni che informazioni sull’IA, qualcosa che è davvero unico nel suo genere per il suo lavoro nel gruppo.

Inoltre, in ogni caso, quando la struttura dà tutto ciò di cui si ha bisogno per la programmazione astuta, ci possono ancora essere problemi con l’assenza di controllo dei calcoli. Enormi sistemi neurali mettono da parte un enorme sforzo di preparazione. Questo tempo prezioso potrebbe essere ridotto da una richiesta di dimensioni nel caso in cui si utilizzino sistemi di GPU che girano su macchine all’avanguardia. Siete voi a esplorare i potenziali risultati, a vedere i lati positivi e negativi delle diverse alternative di cloud e a scegliere quella più adatta.

Si può anche essere responsabile per la scelta di diversi dispositivi e ambienti, pensando continuamente all’intero ciclo di vita dell’impresa (non semplicemente la parte di ricerca folle) – per esempio Sky blue ML Workbench o IBM Watson possono essere strumenti straordinari per il bootstrapping il compito e l’esplorazione di guida, ma non soddisfare tutte le esigenze della vostra ultima forma dell’oggetto per quanto riguarda la prenotazione personalizzata e l’osservazione.

Si dovrebbe tenere sveglio fino ad oggi con le condizioni di avanzamento dell’artigianato e cercare continuamente i punti in cui l’esecuzione generale dell’oggetto potrebbe essere migliorata. Che si tratti di un linguaggio di programmazione collaudato, di nuove innovazioni nel cloud, di un’attenta pianificazione o di un quadro di controllo – osservando il vostro oggetto sul master plan e rendendolo ben realizzato sia dal punto di vista della progettazione, sia dal punto di vista commerciale e scientifico, siete spesso l’individuo principale che ha la possibilità di riconoscere la potenziale zona di progresso.

Questo implica regolarmente prendere il codice di lavoro e cambiarlo completamente in un’altra innovazione e in un altro linguaggio. Fortunatamente, quando si “prende in mano” ciò di cui si parla in realtà e quali passi vengono costantemente compiuti durante il tempo trascorso ad apprendere e a produrre i modelli, si capisce che una gran parte di queste API non contrasta per nulla con l’immaginazione. Nel momento in cui si passa da una struttura all’altra, la maggior parte dell’intera procedura rimane di gran lunga l’equivalente. Si portano tutte le migliori prove di programmazione artigianale e si inizia rapidamente a fabbricare una riflessione su numerose imprese noiose che il gruppo di scienze dell’informazione trascura di meccanizzare e il gruppo di avanzamento della programmazione è riluttante a dare un’occhiata. Una solida connessione tra due universi. Un’istituzione forte e vigorosa per la programmazione di lavoro.