Семантическая сегментация изображений дистанционного зондирования играет важную роль в определении изменений в городах, охране окружающей среды, распознавании геологических катастроф и других областях. Для решения проблем пропуска, ложных срабатываний и неполного извлечения зданий из-за загораживания деревьями или помех похожих объектов в существующих методах извлечения, в данной статье предложена улучшенная сеть извлечения зданий на основе сети UNet — сеть объединения локальных и глобальных признаков (Fusion of local global features network, FLGF-UNet). Параллельное слияние признаков в FLGF-UNet обеспечивает включение в признаки каждого этапа как детализированной локальной информации, так и глобальных зависимостей, позволяя сети иметь локальную и глобальную информацию на каждом этапе представления признаков, эффективно устраняя недостатки Transformer в локальном обмене информацией и превосходя традиционные CNN в моделировании глобальной информации. Кроме того, для устранения семантического разрыва между кодировщиком и декодировщиком был добавлен модуль интерактивного слияния (Interactive Fusion, IF), усиливающий эффект объединения пространственных деталей, глобального контекста и семантических признаков. Для проверки превосходства и универсальности FLGF-UNet проведено сравнение предложенной сети с U2Net, Swin Transformer, MA-Net, HD-Net и RS-Mamba на наборах данных WHU, Massachusetts и наборах данных зданий типичных китайских городов. Результаты показали, что FLGF-UNet превосходит другие сети SOTA по производительности и обладает высокой практической ценностью.
关键词
изображения дистанционного зондирования; извлечение зданий; сеть объединения локальных и глобальных признаков; слияние признаков; модуль интерактивного слияния