Método de interpretación fina de bajo costo para imágenes de teledetección basado en segmentación de instancias débilmente supervisada

CHEN Man ,  

HUANG Yongjie ,  

XU Lei ,  

PAN Zhisong ,  

摘要

La segmentación de instancias en imágenes de teledetección puede lograr simultáneamente la localización a nivel de objeto de interés y la clasificación a nivel de píxel, siendo una tarea importante y muy desafiante. La mayoría de los métodos actuales de segmentación de instancias en imágenes de teledetección dependen de anotaciones precisas a nivel de píxel, cuyo costo de producción es alto. Además, los fondos mezclados y los contornos complejos de los objetos en las imágenes de teledetección también aumentan la dificultad de la segmentación. Para enfrentar estos desafíos, este artículo construye un sistema de información prioritaria adecuado para la tarea de segmentación de instancias débilmente supervisada en imágenes de teledetección, y propone una red de segmentación de instancias débilmente supervisada basada en múltiples criterios prioritarios. Específicamente, la información prioritaria en la tarea de segmentación de instancias débilmente supervisada se divide según su origen en prioridad de tarea y prioridad de imagen, donde la prioridad de tarea se origina de la tarea de detección de cajas delimitadoras estrechamente relacionada con la segmentación de instancias, y la prioridad de imagen proviene de la inducción y extracción de la información propia de la imagen. Además, se diseñan tres componentes específicos para materializar la información de prioridad de tarea: restricción de coherencia de proyección de cuadro-máscara, función de caracterización de dificultad de distinción de píxeles y restricción de prioridad de posición central, que impulsan la red a determinar el tamaño de la máscara y a centrarse plenamente en los píxeles y áreas clave de la imagen; se diseñan dos componentes para construir la información de prioridad de imagen: restricción de coherencia visual de vecindad y restricción de coherencia de gradiente, que permiten a la red distinguir eficazmente entre primer plano y fondo y adaptarse a los contornos complejos de los objetivos en las imágenes de teledetección. Los resultados experimentales en conjuntos de datos de imágenes de teledetección ópticas y SAR muestran que el método propuesto logra valores AP de 52.5 y 54.1 respectivamente sin necesidad de ninguna anotación a nivel de píxel, superando los métodos actuales de segmentación débilmente supervisada y alcanzando el 89.3 % y el 84.3 % del Mask R-CNN supervisado completamente. Este método puede proporcionar una solución de alto rendimiento y bajo costo para la interpretación fina de imágenes de teledetección.

关键词

imágenes de teledetección; segmentación de instancias; interpretación fina; aprendizaje débilmente supervisado; información prioritaria; sistema impulsor; contornos de objetos; costo de anotación

阅读全文