Presentamos un sistema general, adaptable y muy sencillo para la segmentación de los objetos. Nuestra metodología identifica de forma competente las preguntas de un cuadro mientras crea una excelente cobertura de división para cada ocurrencia. La técnica, llamada Máscara R-CNN, amplía el R-CNN más rápido al incluir una rama para prever una cobertura de objeto en paralelo con la rama actual para el reconocimiento de cajas de rebote. La cubierta R-CNN es fácil de preparar y añade sólo un poco de sobrecarga al R-CNN más rápido, funcionando a 5 fps. Además, la máscara R-CNN es cualquier cosa menos difícil, para resumir en diferentes empresas, por ejemplo, nos permite medir las posturas humanas en un sistema similar. Mostramos los mejores resultados en cada una de las tres pistas del conjunto de dificultades del COCO, incluyendo la división de ejemplos, la identificación de objetos en cajas de salto y el reconocimiento de puntos clave individuales. Sin grandes dificultades, la máscara R-CNN supera todas las secciones actuales de un solo modelo en cada recado, incluyendo los vencedores de la prueba COCO 2016. Confiamos en que nuestra metodología directa y viable se rellene como un patrón fuerte y ayude a facilitar la investigación futura en el reconocimiento del nivel de ejemplo