FLGF-UNet: red de extracción de edificios de imágenes ópticas de teledetección fusionando características locales y globales

LI Guoyan ,  

LIU Tao ,  

WANG Li ,  

LIU Yi ,  

摘要

La segmentación semántica de imágenes de teledetección desempeña un papel importante en la detección de cambios urbanos, la protección ambiental, el reconocimiento de desastres geológicos y otros campos. Para abordar los problemas actuales en la extracción de edificios a partir de imágenes de teledetección, como omisiones, falsas detecciones e extracción incompleta debido a la obstrucción de árboles o la interferencia de objetos similares, este artículo propone una red mejorada de extracción de edificios basada en la red UNet: la red de fusión de características locales y globales FLGF-UNet (Fusion of Local Global Features Network). La fusión paralela de características en FLGF-UNet garantiza que cada etapa incluya información local detallada y dependencias globales, permitiendo que la red posea información local y global en la representación de características en cada etapa, superando eficazmente las limitaciones del Transformer en el intercambio de información local y superando a las CNN tradicionales en el modelado de información global. Además, para compensar la brecha semántica entre el codificador y el decodificador, se añade un módulo de fusión interactiva IF (Interactive Fusion) que mejora la integración de detalles espaciales, contexto global y características semánticas. Para validar la superioridad y generalización de FLGF-UNet, la red propuesta se comparó con U2Net, Swin Transformer, MA-Net, HD-Net y RS-Mamba en los conjuntos de datos WHU, Massachusetts y conjuntos de datos de edificios urbanos típicos en China. Los resultados muestran que FLGF-UNet supera en rendimiento a otras redes SOTA y tiene un alto valor de aplicación práctica.

关键词

imágenes de teledetección; extracción de edificios; red de fusión de características locales y globales; fusión de características; módulo de fusión interactiva

阅读全文