Fernerkundungsbilder weisen große Maßstabsänderungen von Objekten, eine dichte Verteilung der Objekte, leicht zu verwechselnde ähnliche Objekte, komplexen Hintergrund mit vielen Störungen sowie unzureichende Bilddetails auf. Bestehende Rotationsobjekterkennungsalgorithmen haben oft eine hohe Rechenlast und bieten noch Spielraum für Verbesserungen bei der Genauigkeit. Zur Lösung der genannten Probleme verbessert diese Studie den derzeit führenden YOLOv9-Detektor und entwickelt einen effizienten und genauen Rotationsobjekterkenner für Fernerkundungsbilder namens RSO-YOLO (YOLO für Fernerkundungsbilder mit orientiertem Begrenzungsrahmen). Zunächst wird ein Low-Light-Fernerkundungsbild-Hilfsdatenaugmentationsmodul eingesetzt, um Probleme wie schwaches Licht, Rauschen, Unschärfe und unzureichenden Kontrast zu verbessern; zweitens wird ein entkoppelter Winkelvorhersagekopf entwickelt, der dem Algorithmus die Fähigkeit zur Wahrnehmung der Ausrichtung von Zielen in der Fernerkundung verleiht; außerdem wird im Modell ein auf dem Kalman-Filter basierender Intersection-over-Union-KFIoU-Verlust eingeführt, um das Winkelperiodizitätsproblem bei der Darstellung von Rotationsobjekten zu lösen; mithilfe des Verteilungsfokus-Verlusts DFL (Distribution Focal Loss) wird die Verteilung des Rotationsbegrenzungsrahmens erlernt, wodurch das Problem der Winkelungenauigkeit bei nahezu quadratischen Zielen bei der Gaußschen Modellierung verringert wird; des Weiteren wird eine dynamische Etikettierungszuweisungsstrategie für die Rotationsobjekterkennung erstellt, die während der Zuweisung sowohl Intersection over Union (IOU) als auch Klassenscores berücksichtigt, um einen Musteraum zu schaffen, der die Eigenschaften der Ziele besser widerspiegelt; schließlich wird eine auf der Hellinger-Distanz basierende probabilistische Intersection-over-Union (ProbIoU) für die nicht-maximale Unterdrückung verwendet, um die Rechenlast der nicht-maximalen Unterdrückung zu reduzieren. Der vorgeschlagene Rotationsobjekterkenner für Fernerkundungsbilder wurde experimentell auf dem öffentlichen DIOR-R-Datensatz validiert und mit mehreren typischen Rotationsobjekterkennungsmethoden verglichen. Die Ergebnisse zeigen, dass die vorgeschlagene RSO-YOLO-Methode eine kombinierte Erkennungsgenauigkeit von 81,1 % mAP (mean Average Precision) erreicht, den ersten Platz belegt und gleichzeitig die Echtzeitfähigkeit der Erkennung sicherstellt. Darüber hinaus kann durch das Hilfsdatenaugmentationsmodul die mAP um 1,5 % erhöht werden. Zusammenfassend kombiniert die vorgeschlagene RSO-YOLO-Methode Geschwindigkeit und Genauigkeit der Rotationsobjekterkennung und besitzt einen praktischen Wert sowie Anwendungspotenzial in fernerkundungsbezogenen Szenarien wie der maritimen und Flughafenüberwachung, der Stadtverwaltung, der Katastrophenbewertung, der Agrar- und Forstinspektion und bietet zudem modulare, wiederverwendbare Lösungen für zukünftige Forschungen zur Rotationsdetektion unter Bedingungen von Schwachlicht und komplexem Hintergrund.
关键词
tiefes Lernen;Fernerkundungszielerkennung;Rotationsrahmen;Datenaugmentation;strategien zum Matching positiver und negativer Beispiele für Rotationsrahmen;zweidimensionale Gaußsche Verteilung