Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

La ejecución del reconocimiento de objetos, según lo estimado en el conjunto de datos de COV PASCAL aceptado, se ha nivelado en los últimos dos años. Las mejores estrategias de ejecución son los marcos de equipo impredecibles que comúnmente consolidan los diferentes puntos destacados de la imagen de bajo nivel con una configuración de nivel significativa. En este documento, proponemos un cálculo de descubrimiento básico y versátil que mejora la precisión normal media (Guía) en más de un 30% en comparación con el mejor resultado anterior en el COV 2012 – logrando una Guía del 53,3%. Nuestra metodología consolida dos experiencias clave: (1) se pueden aplicar sistemas neurales convolucionales de alto límite (CNN) para basar la proposición del distrito de manera que se restrinja y fragmente los elementos y (2) cuando la información de preparación marcada es rara, la preparación regulada para una tarea de ayuda, seguida por la calibración explícita del área, produce un apoyo de exhibición notable. Desde que unimos la proposición del distrito con las CNN, llamamos a nuestra estrategia R-CNN: Locales con puntos destacados de la CNN. Además contrastamos R-CNN con OverFeat, un buscador de ventanas deslizantes propuesto últimamente que depende de una ingeniería comparable de CNN. Encontramos que el R-CNN late