Le più moderne reti di rilevamento degli oggetti dipendono dagli algoritmi di proposta delle regioni per ipotizzare la posizione degli oggetti. I progressi come SPPnet e Fast R-CNNN hanno ridotto il tempo di funzionamento di questi sistemi di localizzazione, scoprendo il calcolo della proposta di distretto come un collo di bottiglia. In questo lavoro, presentiamo un Region Proposal Network (RPN) che offre un’immagine completa e convoluzionale con l’organizzazione del riconoscimento, dando così potere alla proposta distrettuale senza costi. Una RPN è un’organizzazione completamente convoluzionale che allo stesso tempo prevede i limiti degli articoli e i punteggi degli oggetti in ogni posizione. L’RPN è pronta a cominciare a finire per produrre una grande proposta distrettuale, che viene utilizzata da Fast R-CNNN per l’identificazione. Noi consolidiamo ulteriormente RPN e Fast R-CNNN in un sistema solitario condividendo i loro punti salienti convoluzionali – utilizzando il fraseggio dei sistemi neurali con strumenti di “considerazione”, il segmento RPN consiglia al sistema riunito dove guardare. Per il modello VGG-16, estremamente profondo, il nostro framework di identificazione ha un ritmo di alloggiamento di 5 fps (contando tutti i mezzi) su una GPU, mentre realizza la migliore precisione di riconoscimento degli oggetti della classe su PASCAL VOC 2007, 2012, e i dataset MS COCO con appena 300 raccomandazioni per ogni immagine. Nelle rivalità ILSVRC e COCO 2015, R-CNNN e RPN più veloci sono gli stabilimenti dei primi passaggi vincenti in poche tracce. Il codice è stato reso apertamente accessibile.
Previous Article