Studie zu einem Bildzerlegungs-Entwirrungs- und kantengeführten Algorithmus für die semantische Segmentierung von Fernerkundungsbildern

LIAN Yuanfeng ,  

LI Keke ,  

摘要

Fernerkundungsbilder zeichnen sich durch signifikante Unterschiede in der Objektgröße, komplexe und variable Hintergründe sowie spektrale Verwechslungen von Objekten und unscharfe Merkmalgrenzen aus, was die Aufgabe der semantischen Segmentierung erschwert. Um das Problem der Schwierigkeit der semantischen Segmentierung von Zielen in Fernerkundungsbildern aufgrund der gegenseitigen Abhängigkeit von Merkmalen unter unterschiedlichen Beleuchtungsbedingungen zu lösen, schlägt dieser Artikel ein semantisches Segmentierungsmodell für Fernerkundungsbilder auf Basis der Entwirrung vor, das aus einem Lichtreflexions-Entwirrungsnetzwerk (LRD-Net) und einem multimodalen semantischen Segmentierungsnetzwerk (MSS-Net) besteht. Zunächst wurde basierend auf der Retinex-Theorie das LRD-Net Netzwerk entwickelt, um Beleuchtungs- und Reflexionseigenschaften in optischen Bildern zu zerlegen und mit einem gewichtsgemeinsamen Transformer (WS-Transformer) globale und lokale Merkmale von Zielen zu extrahieren. Danach wird ein Multiskalenrauschmodul eingeführt, um die Beleuchtungskomponente adaptiv zu verstärken und die Entwirrungsfähigkeit des Modells zu verbessern. Über das signifikante Merkmalsverstärkungsmodul (SE) werden Differenzinformationen zwischen den verschiedenen Komponenten hervorgehoben. Abschließend wird ein Kantenmerkmalextraktionsmodul (EE) verwendet, um die Kantenerkennung von Fernerkundungszielen zu verbessern, und über das multimodale semantische Segmentierungsnetzwerk (MSS-Net) werden Beleuchtungs- und Reflexionsmerkmale fusioniert, um die semantische Segmentierungsleistung zu steigern. Auf den allgemeinen Datensätzen ISPRS Vaihingen und ISPRS Potsdam erreichten die Bewertungskennzahlen mIoU 84,60 % beziehungsweise 87,42 %. Die experimentellen Ergebnisse zeigen, dass das vorgeschlagene Modell bei der semantischen Segmentierungsaufgabe von Fernerkundungsbildern anderen Modellen überlegen ist.

关键词

semantische Segmentierung;Bildzerlegung;Retinex-Theorie;Transformer

阅读全文