FLGF-UNet: Rede de Extração de Edifícios de Imagens Ópticas de Sensoriamento Remoto com Fusão de Características Locais e Globais

LI Guoyan ,  

LIU Tao ,  

WANG Li ,  

LIU Yi ,  

摘要

A segmentação semântica de imagens de sensoriamento remoto desempenha um papel importante na detecção de mudanças urbanas, proteção ambiental, reconhecimento de desastres geológicos e outros campos. Para resolver os problemas atuais de falta, falsas detecções e extração incompleta causadas por bloqueio de árvores ou interferência de objetos semelhantes na extração de edifícios de sensoriamento remoto, este artigo propõe uma rede de extração de edifícios aprimorada baseada na rede UNet — a rede de fusão de características locais e globais FLGF-UNet (Fusion of Local Global Features Network). O método de fusão paralela de características do FLGF-UNet garante que cada estágio contenha informações locais em detalhes finos e dependências globais, permitindo que a rede possua informações locais e globais na representação de características de cada estágio, superando efetivamente as limitações do Transformer na troca de informações locais e sendo superior às CNNs tradicionais na modelagem de informações globais. Além disso, para compensar a lacuna semântica entre o codificador e o decodificador, foi adicionado um módulo de fusão interativa IF (Interactive Fusion) entre eles, reforçando o efeito de fusão de detalhes espaciais, contexto global e características semânticas. Para validar a superioridade e generalização do FLGF-UNet, a rede proposta foi comparada com U2Net, Swin Transformer, MA-Net, HD-Net e RS-Mamba nos conjuntos de dados WHU, Massachusetts e conjuntos típicos de edifícios urbanos da China. Os resultados mostram que o FLGF-UNet supera outras redes SOTA em desempenho e possui alto valor prático.

关键词

imagens de sensoriamento remoto; extração de edifícios; rede de fusão de características locais e globais; fusão de características; módulo de fusão interativa

阅读全文