As pedras amplamente distribuídas na superfície de Marte representam uma ameaça potencial para a condução segura dos rovers marcianos, ao mesmo tempo em que as características da distribuição das pedras fornecem pistas importantes para o estudo da evolução geológica das áreas de pouso em Marte. No entanto, o reconhecimento de pedras nas imagens dos rovers marcianos enfrenta múltiplos desafios: os contornos borrados entre as pedras e o fundo dificultam a extração do contorno, a semelhança das características da textura da superfície provoca erros, e a escassez de conjuntos de dados reais de pedras marcianas limita o treinamento dos modelos. Para alcançar um reconhecimento preciso das pedras nas imagens dos rovers marcianos, este artigo propõe um modelo automático de reconhecimento de pedras baseado em uma rede convolucional com autoatenção, realizando segmentação em nível de pixel da imagem. O modelo adota uma arquitetura codificador-decodificador, onde o codificador baseado em rede neural convolucional extrai características da imagem e incorpora um módulo de autoatenção aprimorado para fortalecer a capacidade do modelo na percepção de informações contextuais; o decodificador é responsável por mapear as características extraídas pelo codificador de volta ao espaço da imagem, permitindo uma segmentação precisa. Para validar a performance do modelo, este artigo anotou imagens do rover "Zhurong" e construiu o conjunto de dados Tianwen, combinando vários conjuntos de dados, como os simulados Synmars, Simmars6k, e o conjunto de dados de imagens do rover "Curiosity" MarsData-v2, para testar e validar o desempenho do modelo. Além disso, este modelo foi comparado quanto à precisão com diversos métodos, incluindo DeepLabv3+, Unet++, Segformer, Marsnet. A avaliação usando métricas como precisão média por pixel, taxa de recall e índice de interseção sobre união indicou que o modelo pode reconhecer pedras com precisão, alcançando mais de 90% de precisão e recall em conjuntos de dados simulados, e mostrando o melhor desempenho em conjuntos reais.
关键词
Marte; extração de pedras; rede neural convolucional; Transformer; extração de características