Algorithme de segmentation sémantique d'images de télédétection basé sur la décomposition d'image, le désenchevêtrement et la guidage par contour

LIAN Yuanfeng ,  

LI Keke ,  

摘要

Les images de télédétection présentent des différences significatives de taille des cibles et des arrière-plans complexes et variables, avec des phénomènes tels que la confusion spectrale des objets et les frontières de caractéristiques floues, ce qui augmente la difficulté de la tâche de segmentation sémantique. Pour résoudre le problème des difficultés de segmentation sémantique des objectifs dans les images de télédétection sous différentes conditions d'éclairage, dues à l'interdépendance des caractéristiques, cet article propose un modèle de segmentation sémantique des images de télédétection basé sur la désenchevêtrement, composé d'un réseau de désenchevêtrement de l'éclairage-réflexion (LRD-Net) et d'un réseau de segmentation sémantique multimodal (MSS-Net). Tout d'abord, le réseau LRD-Net est conçu sur la base de la théorie Retinex pour décomposer les caractéristiques d'éclairage et de réflexion dans les images optiques, en extrayant les caractéristiques globales et locales des cibles via un Transformer à partage de poids (WS-Transformer); ensuite, un module de bruit multi-échelle est introduit pour renforcer adaptativement la composante d'éclairage afin d'améliorer la capacité de désenchevêtrement du modèle, en soulignant les différences entre les caractéristiques des différentes composantes via un module de renforcement des caractéristiques saillantes (SE); enfin, un module d'extraction des caractéristiques de bord (EE) est utilisé pour améliorer la capacité à reconnaître les contours des cibles de télédétection, et les caractéristiques d'éclairage et de réflexion sont fusionnées via un réseau de segmentation sémantique multimodal (MSS-Net) pour améliorer les performances de segmentation sémantique. Sur les ensembles de données publics ISPRS Vaihingen et ISPRS Potsdam, les indices mIoU atteignent respectivement 84,60 % et 87,42 %. Les résultats expérimentaux montrent que le modèle proposé surpasse les autres modèles dans la tâche de segmentation sémantique des images de télédétection.

关键词

segmentation sémantique;décomposition d'image;théorie Retinex;Transformer

阅读全文