La detección de cambios semánticos en imágenes de teledetección desempeña un papel importante en el medio ambiente ecológico, el uso de la tierra, la monitorización de la cobertura terrestre y otros aspectos. En los últimos años, los métodos de detección de cambios basados en aprendizaje profundo han sido un punto focal en la interpretación inteligente de imágenes de teledetección. Sin embargo, los métodos actuales de detección de cambios semánticos de tres ramas carecen de modelado de la coherencia entre la rama de cambios y la rama semántica, lo que conduce a contradicciones en la detección semántica de cambios en dos períodos de tiempo. Para abordar este problema, este artículo propone un algoritmo de detección de cambios semánticos en imágenes de teledetección basado en una CNN gemela y Transformer. En la fase de codificación, primero se diseña una red ResNet34 gemela para extraer características multiescala de la imagen y se inserta un módulo de mejora de diferencias para aumentar la atención a la información de cambio; luego se utiliza un marcador semántico para mapear el mapa de características en tokens semánticos compactos, y mediante un codificador Transformer se modela conjuntamente la información semántica y de cambios de dos períodos para modelar la coherencia “semántica-cambio”. En la fase de decodificación, mediante el decodificador Transformer y conexiones de salto se fusiona la información semántica de diferentes niveles de granularidad para generar un mapa de características semánticas refinado; tras el sobremuestreo y la multiplicación por máscara se obtiene el resultado de cambios semánticos de dos períodos. Los resultados experimentales en los conjuntos de datos públicos de detección de cambios semánticos en teledetección SECOND y Landsat-SCD muestran que el algoritmo propuesto puede centrarse eficazmente en las áreas de cambio, mantener la coherencia entre los resultados de cambios y resultados semánticos, y alcanzar excelentes métricas de evaluación y efectos visuales.
关键词
imágenes de teledetección; detección de cambios; coherencia semántica; mejora de diferencias; características multiescala; red gemela; ResNet34; Transformer