Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Hochmoderne Objekterfassungsnetzwerke hängen von Algorithmen für Regionsvorschläge ab, um Hypothesen über die Lage von Objekten aufzustellen. Fortschritte wie SPPnet und Fast R-CNN haben die Laufzeit dieser Ortungssysteme verringert und die Berechnung von Gebietsvorschlägen als Engpass aufgedeckt. In dieser Arbeit stellen wir ein Regionsvorschlagsnetzwerk (RPN) vor, das Faltungshighlights im Vollbild mit der Anerkennung arrangiert und dementsprechend etwa kostenfreie Distriktvorschlagsberechnung ermöglicht. Ein RPZ ist eine vollständig konvolutionäre Organisation, die gleichzeitig Artikelgrenzen und Objektbewertungen an jeder Position vorhersagt. Die RPZ ist bereit, von Anfang bis Ende einen großartigen Distriktvorschlag zu erarbeiten, der von Fast R-CNN zur Identifizierung genutzt wird. Wir konsolidieren die RPZ und die Schnelle R-CNN zu einem einsamen System, indem wir die Höhepunkte ihrer Faltung mit anderen teilen – unter Verwendung der späten Mainstream-Phrasierung neuronaler Systeme mit “Rücksichtnahme”-Instrumenten berät das RPZ-Segment das zusammengebrachte System, wo es suchen soll. Für das extrem tiefgründige VGG-16-Modell hat unser Identifikationsrahmen eine Gehäusegeschwindigkeit von 5 Bildern pro Sekunde (alle Mittelwerte gezählt) auf einer GPU und erreicht gleichzeitig die beste Objekterkennungspräzision seiner Klasse bei PASCAL VOC 2007, 2012 und MS COCO-Datensätzen mit nur 300 Empfehlungen für jedes Bild. In den Rivalitäten zwischen ILSVRC und COCO 2015 sind Schnellere R-CNN und RPN die Etablierung der ersten Spot-Gewinner-Passagen in einigen wenigen Tracks. Der Code wurde offen zugänglich gemacht.

Languages

Weekly newsletter

No spam. Just the latest releases and tips, interesting articles, and exclusive interviews in your inbox every week.