Método de reconocimiento de piedras en la superficie de Marte basado en red convolucional con autoatención

CAO Xuehuan ,  

PENG Man ,  

WAN Wenhui ,  

WANG Biao ,  

WANG Yexin ,  

DI Kaichang ,  

LI Lu ,  

摘要

La amplia distribución de piedras en la superficie de Marte representa una amenaza potencial para la seguridad de la conducción de los rovers marcianos, al mismo tiempo que las características de distribución de las piedras proporcionan pistas importantes para el estudio de la evolución geológica de las zonas de aterrizaje en Marte. Sin embargo, el reconocimiento de piedras en las imágenes de los rovers marcianos enfrenta múltiples desafíos: los bordes borrosos entre las piedras y el fondo dificultan la extracción de contornos, la similitud en las características de la textura superficial provoca falsos positivos, y la escasez de conjuntos de datos reales de piedras marcianas limita el entrenamiento del modelo. Para lograr un reconocimiento preciso de piedras en las imágenes de los rovers marcianos, este artículo propone un modelo automático de reconocimiento de piedras basado en una red convolucional con autoatención, que realiza segmentación a nivel de píxel en la imagen. El modelo adopta una arquitectura codificador-decodificador, donde el codificador basado en una red neuronal convolucional extrae características de la imagen e integra un módulo de autoatención mejorado para mejorar la capacidad de percepción contextual del modelo; el decodificador es responsable de mapear las características extraídas por el codificador de regreso al espacio de la imagen para una segmentación precisa. Para validar el rendimiento del modelo, este artículo anotó imágenes del rover "Zhurong" y construyó el conjunto de datos Tianwen, combinando conjuntos de datos simulados de piedras Synmars, Simmars6k y conjuntos de datos de imágenes del rover "Curiosity" MarsData-v2 para probar y validar el rendimiento del modelo. Además, este modelo se compara en precisión con varios métodos, incluidos DeepLabv3+, Unet++, Segformer, Marsnet. La evaluación mediante métricas como precisión media de píxeles, tasa de recuperación e índice de intersección sobre unión indica que el modelo puede identificar piedras con precisión, alcanzando más del 90% en precisión y tasa de recuperación en conjuntos de datos simulados, y mostrando el mejor rendimiento en conjuntos de datos reales.

关键词

Marte; extracción de piedras; red neuronal convolucional; Transformer; extracción de características

阅读全文