Die Erkennung von gerichteten Objekten mit Fernerkundungsbildern ist eine herausfordernde Aufgabe im Bereich der Computer Vision, da herkömmliche Methoden des horizontalen Rahmens keine präzise Lokalisierung von Objekten verschiedener Größen, willkürlicher Ausrichtung und dichter Anordnung ermöglichen. Die derzeit weit verbreitete fiv-parametergerichtete Rahmendarstellung, aufgrund der Periodizität des Richtungswinkels und des Problems des Grenztauschs, erhöht die Komplexität des Modelltrainings. Um die oben genannten Probleme zu lösen, wird in diesem Artikel ein Modell zur Erkennung von gerichteten Objekten auf der Basis der elliptischen Gleichung EllipticNet (Netzwerk zur Erkennung von gerichteten Objekten auf Basis der elliptischen Gleichung) vorgestellt. Erstens zerlegt EllipticNet das Problem der Winkelvorhersage in zwei Teilprobleme: quantitative Winkelregression und Richtungsklassifizierung, wodurch das Problem der Diskontinuität der Grenzen des fünfparametrigen gerichteten Rahmens überwunden wird. Darüber hinaus wird in diesem Artikel eine an die Ellipse gebundene Verlustfunktion vorgeschlagen, die die internen geometrischen Beziehungen zwischen den Ellipsenparametern verbessert und die Robustheit des EllipticNet-Trainings erhöht. Darüber hinaus wird in diesem Artikel ein Schichtenweise hohler Raumfaltungspyramidenmodul vorgestellt, das die Fähigkeit von EllipticNet zur Darstellung von Mehrskalenmerkmalen signifikant verbessert. Schließlich zeigen vergleichende Experimente an bekannten Fernerkundungsdatensätzen wie DOTA, HRSC2016 und UCAS_AOD, dass der in diesem Artikel vorgestellte Ansatz bezüglich Leistung und Effizienz wettbewerbsfähig ist und somit den praktischen Wert dieses Ansatzes bei der Erkennung von gerichteten Objekten in Fernerkundungsbildern untermauert.
关键词
Erkennung von gerichteten Objekten, elliptische Gleichung, Merkmalsverbesserung, hochauflösende Fernerkundungsbilder