FLGF-Unet: Netzwerk zur Gebäudextraktion optischer Fernerkundungsbilder mit Fusion lokaler und globaler Merkmale

LI Guoyan ,  

LIU Tao ,  

WANG Li ,  

LIU Yi ,  

摘要

Die semantische Segmentierung von Fernerkundungsbildern spielt eine wichtige Rolle bei der Erkennung städtischer Veränderungen, dem Umweltschutz, der Identifizierung geologischer Katastrophen und anderen Bereichen. Zur Lösung der aktuellen Probleme wie Fehlerkennung, Fehlalarme und unvollständige Extraktion aufgrund von Baumverdeckung oder ähnlichen Störobjekten bei der Fernerkundungsgebäudeextraktion wird in dieser Arbeit ein verbessertes Gebäudextraktionsnetzwerk auf Basis des UNet-Netzwerks vorgeschlagen – das Netzwerk zur Fusion lokaler und globaler Merkmale (Fusion of local global features network, FLGF-UNet). Die parallele Merkmalfusion von FLGF-UNet stellt sicher, dass jedes Stadium Merkmale mit feinkörnigen lokalen Informationen und globalen Abhängigkeiten enthält, sodass das Netzwerk in jeder Phase der Merkmalsrepräsentation sowohl lokale als auch globale Informationen besitzt. Dies überwindet effektiv die Schwächen des Transformers beim lokalen Informationsaustausch und übertrifft herkömmliche CNNs bei der globalen Informationsmodellierung. Darüber hinaus wird zur Überbrückung der semantischen Kluft zwischen Encoder und Decoder ein interaktives Fusionsmodul (Interactive Fusion, IF) hinzugefügt, das die Fusion von räumlichen Details, globalem Kontext und semantischen Merkmalen verstärkt. Zur Validierung der Überlegenheit und Generalität von FLGF-UNet wurde das vorgeschlagene Netzwerk mit U2Net, Swin Transformer, MA-Net, HD-Net und RS-Mamba auf den Datensätzen WHU, Massachusetts und Datensätzen typischer chinesischer Stadtgebäude verglichen. Die Ergebnisse zeigen, dass FLGF-UNet in der Leistung anderen SOTA-Netzen überlegen ist und einen hohen praktischen Wert besitzt.

关键词

Fernerkundungsbilder; Gebäudextraktion; Netzwerk zur Fusion lokaler und globaler Merkmale; Merkmalsfusion; interaktives Fusionsmodul

阅读全文