Ein Verfahren zur automatischen Erkennung von Steinen auf der Marsoberfläche auf der Grundlage eines Convolutional Neural Network mit integriertem Self-Attention-Modul
Die weit verbreitete Anwesenheit von verstreuten Steinen auf der Oberfläche des Mars stellt eine potenzielle Bedrohung für die Sicherheit der Navigation von Rovern auf seiner Oberfläche dar, während die Streuungseigenschaften der Steine auch wichtige Hinweise für die Untersuchung der geologischen Entwicklung der Landegebiete auf dem Mars bieten. Die Erkennung von Steinen auf Bildern von Mars-Rovern sieht sich jedoch mehreren Herausforderungen gegenüber: Die unscharfe Grenze zwischen Steinen und Hintergrund erschwert das Extrahieren von Konturen, die Ähnlichkeit der Oberflächenstrukturmerkmale führt zu Fehlalarmen, und das Fehlen realer Datensätze über Marssteine beschränkt das Training von Modellen. Um eine präzise Erkennung von Steinen auf Bildern von Mars-Rovern zu erreichen, schlägt dieser Artikel ein Modell zur automatischen Erkennung von Steinen auf der Grundlage eines Convolutional Neural Network mit integriertem Self-Attention-Modul vor. Dieses Modell übernimmt eine Encoder-Decoder-Architektur, bei der der Encoder mithilfe eines Convolutional Neural Network Merkmale des Bildes extrahiert und ein verbessertes Self-Attention-Modul einbettet, um die Fähigkeit des Modells zur Wahrnehmung von Kontextinformationen zu verstärken; der Decoder ist dafür verantwortlich, die extrahierten Merkmale des Encoders auf den Bildraum abzubilden, um eine präzise Segmentierung zu erreichen. Um die Leistung des Modells zu bewerten, wurden in diesem Artikel Bilder des Rovers "Zurong" annotiert, der Datensatz "Tianwen" aufgebaut und die Leistung des Modells an mehreren Datensätzen wie den simulierten Datensätzen Synmars und Simmars6k sowie den Bildern des Rovers "Curiosity" MarsData-v2 getestet und validiert. Darüber hinaus wird das Modell mit mehreren Methoden wie DeepLabv3+, Unet++, Segformer, Marsnet verglichen, um die Genauigkeit zu bewerten. Die Ergebnisse zeigten, dass das Modell in der Lage war, Steine präzise zu erkennen, wobei die Genauigkeit und die Wiedererkennungsrate in simulierten Datensätzen über 90% und in realen Datensätzen überlegen waren.