Estudio del algoritmo de segmentación semántica de imágenes de teledetección basado en la descomposición de imágenes y el guiado de bordes

Lian Yuanfeng ,  

Li Keke ,  

摘要

Las imágenes de teledetección presentan diferencias significativas en el tamaño de los objetivos y una complejidad variada en los fondos, así como la presencia de confusión espectral de los objetos y una falta de nitidez en los bordes de las características, lo que aumenta la dificultad de la tarea de segmentación semántica. Para hacer frente a las dificultades de la segmentación semántica de las imágenes de teledetección debido a la interdependencia de las características de los objetivos en diferentes condiciones de iluminación, este artículo propone un modelo de segmentación semántica de imágenes de teledetección basado en la desenredada de la reflexión de la luz, que consta de la red de desenredado de la reflexión de la luz (LRD-Net) y de la red de segmentación semántica multimodal (MSS-Net). En primer lugar, basado en la teoría de Retinex, LRD-Net se diseña para descomponer las características lumínicas y de reflexión en las imágenes ópticas, utilizando WS-Transformer para extraer las características globales y locales del objetivo; luego, el módulo de ruido a escala múltiple refuerza de forma adaptativa los componentes lumínicos para mejorar la capacidad del modelo para desenredar, resaltando las diferencias de información entre los componentes a través del módulo de amplificación de las características significativas (SE). Finalmente, el módulo de extracción de características de borde (EE) mejora la capacidad para reconocer los bordes de los objetivos de teledetección, y MSS-Net, una red de segmentación semántica multimodal, fusiona las características lumínicas y de reflexión para mejorar el rendimiento de la segmentación semántica. En los conjuntos de datos ISPRS Vaihingen y ISPRS Potsdam, el índice mIoU alcanza el 84,60% y el 87,42% respectivamente. Los resultados de los experimentos muestran que el modelo propuesto en este artículo es superior a otros modelos en la tarea de segmentación semántica de imágenes de teledetección.

关键词

Segmentación semántica; Descomposición de imágenes; Teoría de Retinex; Transformador

阅读全文