Extracción detallada de objetivos típicos en imágenes SAR basada en la sinergia espectral-espacial

YANG Han ,  

SUN Minhong ,  

WANG Xinyi ,  

LIU Jin ,  

ZENG Deguo ,  

DING Chenwei ,  

WEI Shiqing ,  

摘要

Las imágenes de Radar de Apertura Sintética (SAR, Synthetic Aperture Radar) presentan ruido de moteado coherente intrínseco, lo que dificulta captar con precisión las relaciones entre objetos complejos, haciendo que la tarea de extracción de objetivos en imágenes SAR sea muy desafiante. Los métodos actuales de extracción de objetivos mediante aprendizaje profundo muestran problemas de precisión debido al ruido de moteado y la influencia de objetos complejos. Por ello, este estudio propone una red Transformer sinérgica espectral-espacial llamada S3T-Net (Spectral-spatial synergetic transformer network) para la extracción detallada de objetivos típicos en imágenes SAR. La red combina una unidad de codificación espectral y una unidad de codificación de Transformer visual (ViT) para extraer y fusionar características de imágenes SAR. La unidad de codificación espectral emplea el muestreo descendente mediante transformada discreta de wavelet (DWT) y la atención dual espectral-jerárquica SHDA (Spectral-hierarchical dual-domain attention) para capturar detalles locales de textura y reducir la sensibilidad al ruido en el dominio espectral, mientras que la unidad ViT usa su mecanismo global de autoatención para comprender la estructura general de la imagen y las dependencias a larga distancia. Además, este estudio utiliza la confluencia sinérgica de características ponderadas SWFC (Synergistic weighted feature confluence) para integrar la información de las dos unidades de codificación, y diseña un módulo recursivo de refinamiento frecuencia-espacial RFSR (Recursive frequency-space refinement) que reduce las interferencias de ruido durante el sobremuestreo y optimiza los bordes de los objetivos. Los resultados experimentales en tres conjuntos de datos públicos SAR para las tareas SARBuD (edificios), HRSID (buques) y FRBS (derrames de petróleo) muestran que el método propuesto supera a varios modelos actuales de última generación (SoTA) en la métrica Dice, con superaciones del 0,52%, 0,62% y 1,04% respectivamente en estos conjuntos. En resumen, el método sinérgico espectral-espacial puede mejorar eficazmente la capacidad de captura de información de objetos en entornos de alta interferencia, proporcionando un nuevo camino técnico y soporte teórico para la tarea de extracción de objetivos en imágenes SAR.

关键词

imágenes SAR; extracción de objetivos; aprendizaje profundo, supresión de ruido; sinergia espectral-espacial; Transformer

阅读全文