Méthode de reconnaissance des pierres à la surface de Mars basée sur un réseau convolutif avec attention autonome

CAO Xuehuan ,  

PENG Man ,  

WAN Wenhui ,  

WANG Biao ,  

WANG Yexin ,  

DI Kaichang ,  

LI Lu ,  

摘要

La large répartition des pierres à la surface de Mars constitue une menace potentielle pour la sécurité de la conduite des rovers martiens, tout en fournissant des indices importants pour l'étude de l'évolution géologique des zones d'atterrissage martiennes. Cependant, la reconnaissance des pierres dans les images des rovers martiens fait face à plusieurs défis : les contours flous entre les pierres et l'arrière-plan rendent l'extraction des contours difficile, la similitude des caractéristiques de texture superficielle entraîne des erreurs de classification, et la rareté des ensembles de données réels de pierres martiennes limite l'entraînement des modèles. Afin de réaliser une reconnaissance précise des pierres dans les images des rovers martiens, cet article propose un modèle de reconnaissance automatique des pierres basé sur un réseau convolutif avec mécanisme d'attention autonome, permettant une segmentation pixel par pixel des images. Le modèle adopte une architecture encodeur-décodeur, où l'encodeur basé sur un réseau de neurones convolutif extrait les caractéristiques des images et intègre un module d'attention autonome amélioré pour renforcer la perception du contexte par le modèle ; le décodeur est responsable de la projection des caractéristiques extraites par l'encodeur dans l'espace image pour une segmentation précise. Pour valider la performance du modèle, cet article a annoté les images du rover "Zhurong" et construit le jeu de données Tianwen, en testant et validant les performances du modèle sur plusieurs jeux de données combinant les jeux de données simulés Synmars, Simmars6k, ainsi que les données d'images du rover "Curiosity" MarsData-v2. En outre, ce modèle a été comparé avec plusieurs méthodes telles que DeepLabv3+, Unet++, Segformer, Marsnet en termes de précision. Les évaluations utilisant la précision moyenne par pixel, le rappel et l'intersection sur l'union montrent que le modèle peut identifier précisément les pierres, atteignant une précision et un rappel supérieurs à 90% sur les ensembles de données simulés, et présentant les meilleurs résultats sur les ensembles réels.

关键词

Mars; extraction des pierres; réseau neuronal convolutif; Transformer; extraction des caractéristiques

阅读全文