Las sombras en las imágenes de teledetección son esenciales para la interpretación de las imágenes y la extracción de elementos del sitio, pero también pueden ser una molestia. Actualmente, aunque ha habido avances en la detección de sombras utilizando el aprendizaje profundo en las imágenes de teledetección, todavía enfrentan desafíos como la omisión, la falsa detección y la complejidad del modelo de red. En este sentido, este estudio presentó una red de detección de sombras de dos ramas que combina las ventajas del Transformador y la red neuronal convolucional (CNN). Este método se basa en una estructura de dos ramas para explorar la información desde dos perspectivas, global y local, para integrar eficazmente las características para capturar con mayor precisión las características de las sombras. Además, al introducir un módulo de predicción de sombras y una función de pérdida conjunta, se mejora aún más la precisión de la detección de sombras. Los resultados de los experimentos en el conjunto de datos de sombras de imágenes aéreas AISD (Aerial Imagery Shadow Dataset) muestran que este método mejora significativamente la precisión de la detección de sombras, alcanzando el 97.112%, y reduce con éxito las falsas detecciones (BER disminuye en 0.389), validando así su eficacia. En última instancia, la red de detección de sombras de dos ramas propuesta en este estudio proporciona una nueva herramienta eficaz para reducir las omisiones y falsas detecciones de sombras pequeñas en las imágenes de teledetección, lo que es de vital importancia para la interpretación de las imágenes de teledetección y la extracción de elementos del sitio.
关键词
imágenes de teledetección; detección de sombras; segmentación semántica; red de dos ramas; integración de características; Transformador; CNN; ResNet