Les réseaux de détection d’objets de pointe dépendent d’algorithmes de proposition de région pour émettre des hypothèses sur l’emplacement des objets. Des progrès tels que SPPnet et Fast R-CNN ont permis de réduire la durée de fonctionnement de ces systèmes de localisation, en révélant le calcul de proposition de région comme un goulot d’étranglement. Dans ce travail, nous présentons un réseau de proposition de région (RPN) qui offre des points forts convolutifs en pleine image avec l’arrangement de reconnaissance, permettant ainsi de proposer des districts à peu près gratuitement. Un RPN est une organisation complètement convolutive qui prédit en même temps les limites des articles et les scores d’objectivité à chaque position. L’IPR est prêt à commencer et à finir pour produire une proposition de district de grande qualité, qui est utilisée par Fast R-CNN pour l’identification. Nous consolidons davantage le RPN et le Fast R-CNN en un système solitaire en partageant leurs points forts convolutifs – en utilisant la formulation courante des systèmes neuronaux avec des instruments de “considération”, le segment RPN conseille le système rassemblé sur l’endroit où il faut regarder. Pour le modèle VGG-16 extrêmement profond, notre cadre d’identification a un rythme de 5 images/seconde (en comptant tous les moyens) sur un GPU, tout en réalisant la meilleure précision de reconnaissance d’objets de sa catégorie sur les ensembles de données PASCAL VOC 2007, 2012 et MS COCO avec seulement 300 recommandations pour chaque image. Dans les rivalités ILSVRC et COCO 2015, Faster R-CNN et RPN sont les établissements des premiers passages gagnants en quelques pistes. Le code a été rendu ouvertement accessible.