Apresentamos um sistema ponderadamente simples, adaptável e geral para segmentação de objetos por exemplo. Nossa metodologia identifica proficientemente questões em uma imagem enquanto cria uma excelente cobertura de divisão para cada ocorrência. A técnica, chamada Máscara R-CNN, amplia o R-CNN mais rápido ao incluir um ramo para prever uma cobertura de item em paralelo com o ramo atual para o reconhecimento de caixas saltitantes. A cobertura R-CNN é fácil de preparar e adiciona apenas um pouco de carga para o Faster R-CNN, funcionando a 5 fps. Além disso, a Máscara R-CNN é tudo menos difícil, para resumir a diferentes empreendimentos, por exemplo, permitindo-nos medir posturas humanas num sistema semelhante. Mostramos os melhores resultados em cada uma das três faixas do conjunto de dificuldades COCO, incluindo divisão de exemplos, identificação de objetos em caixas de salto e reconhecimento de pontos-chave individuais. Sem probabilidades e finalidades extravagantes, a Máscara R-CNN bate todas as seções atuais de um único modelo em cada recado, incluindo os vencedores do teste COCO 2016. Confiamos que a nossa metodologia simples e viável irá preencher como um padrão forte e ajudar a facilitar futuras pesquisas em reconhecimento de nível de exemplo.