Investigación del algoritmo de segmentación semántica de imágenes de teledetección basado en desacoplamiento por descomposición de imagen y guía de borde
Las imágenes de teledetección tienen características de diferencia significativa en el tamaño de los objetivos, fondos complejos y variables, fenómenos de confusión espectral de objetos y límites poco claros de características, lo que aumenta la dificultad de la tarea de segmentación semántica. Para abordar la dificultad de la segmentación semántica de objetivos en imágenes de teledetección debido a la dependencia mutua de características en diferentes condiciones de iluminación, este artículo propone un modelo de segmentación semántica de imágenes de teledetección basado en el desacoplamiento, compuesto por la red de desacoplamiento de reflexión de iluminación (LRD-Net) y la red de segmentación semántica multimodal (MSS-Net). Primero, se diseñó la red LRD-Net basada en la teoría de Retinex para descomponer las características de iluminación y reflexión en imágenes ópticas, extrayendo características globales y locales del objetivo mediante un Transformer con pesos compartidos (WS-Transformer). En segundo lugar, se introduce un módulo de ruido multiescala para mejorar adaptativamente el componente de iluminación y aumentar la capacidad del modelo para desacoplar, destacando la diferencia de información entre diferentes componentes mediante un módulo de fortalecimiento de características relevantes (SE). Finalmente, se utiliza un módulo de extracción de características de borde (EE) para mejorar la capacidad de reconocimiento de bordes de objetivos de teledetección y, mediante la red de segmentación semántica multimodal (MSS-Net), se fusionan las características de iluminación y reflexión para mejorar el rendimiento de la segmentación semántica. En los conjuntos de datos generales ISPRS Vaihingen e ISPRS Potsdam, el índice mIoU alcanzó el 84,60% y 87,42%, respectivamente. Los resultados experimentales demuestran que el modelo propuesto supera a otros modelos en la tarea de segmentación semántica de imágenes de teledetección.
关键词
segmentación semántica;descomposición de imagen;teoría Retinex;Transformer