Die semantische Segmentierung von Fernerkundungsbildern spielt eine wichtige Rolle bei der Erkennung städtischer Veränderungen, dem Umweltschutz, der Identifizierung geologischer Gefahren und anderen Bereichen. Um den aktuellen Problemen wie verpasster Erkennung, Fehlalarmen und unvollständiger Extraktion aufgrund von Baumbedeckung oder Störungen durch ähnliche Objekte bei der Fernerkundungsgebäudeextraktion zu begegnen, wird in dieser Arbeit ein verbessertes Gebäudeextraktionsnetzwerk basierend auf dem UNet-Netzwerk vorgeschlagen – das Fusion der lokalen und globalen Merkmale Netzwerk FLGF-UNet (Fusion of Local Global Features Network). Die parallele Merkmalsfusion von FLGF-UNet stellt sicher, dass jedes Stadium Merkmale mit feinkörnigen lokalen Informationen und globalen Abhängigkeiten enthält, wodurch das Netzwerk in jeder Phase der Merkmalsdarstellung sowohl lokale als auch globale Informationen besitzt. Dadurch werden die Mängel von Transformer beim Austausch lokaler Informationen effektiv überwunden und in der globalen Informationsmodellierung traditionelle CNNs übertroffen. Außerdem wird zur Überbrückung der semantischen Lücke zwischen Encoder und Decoder ein interaktives Fusionsmodul IF (Interactive Fusion) eingefügt, das die Verschmelzung von räumlichen Details, globalem Kontext und semantischen Merkmalen verbessert. Zur Validierung der Überlegenheit und Allgemeingültigkeit von FLGF-UNet wurde das vorgeschlagene Netzwerk mit U2Net, Swin Transformer, MA-Net, HD-Net und RS-Mamba auf den Datensätzen WHU, Massachusetts und typischen städtischen Gebäudedatensätzen Chinas verglichen. Die Ergebnisse zeigen, dass FLGF-UNet in der Leistung andere SOTA-Netzwerke übertrifft und einen hohen praktischen Wert besitzt.
关键词
Fernerkundungsbilder; Gebäudextraktion; Netzwerk zur Fusion lokaler und globaler Merkmale; Merkmalsfusion; Modul für interaktive Fusion