تنتشر الصخور بشكل واسع على سطح المريخ مما يشكل تهديداً محتملاً لسلامة حركة مركبات استكشاف المريخ، وفي الوقت نفسه توفر خصائص توزيع الصخور أدلة هامة لدراسة التطور الجيولوجي لمنطقة هبوط المريخ. مع ذلك، يواجه التعرف على الصخور في صور مركبات المريخ تحديات متعددة: التداخل غير الواضح بين حواف الصخور والخلفية يصعب استخراج الخطوط الخارجية، والتشابه في ميزات نسيج السطح يسبب أخطاء في التمييز، بالإضافة إلى ندرة مجموعات البيانات الحقيقية للصخور على المريخ التي تقيد تدريب النماذج. لتحقيق التعرف الدقيق على الصخور في صور مركبات المريخ، تقترح هذه الدراسة نموذجاً للتعرف التلقائي على الصخور يعتمد على شبكة الالتفاف ذات الانتباه الذاتي، والتي تحقق تقسيم بكسلي للصورة. يأخذ النموذج بنية مُشفّر-مُفكّك حيث يستخلص المشفر ميزات الصورة باعتماد شبكة عصبية التفافية ويُدمج وحدة انتباه ذاتي محسّنة لتعزيز قدرة النموذج على إدراك المعلومات السياقية، بينما يهدف المفكك إلى تحويل ميزات المشفر إلى فضاء الصورة لتحقيق تقسيم دقيق. للتحقق من أداء النموذج، قامت الدراسة بوضع وسوم على صور مركبة تشورونغ المريخية وبناء مجموعة بيانات تيانوين، وأجرت اختبارات أداء متعددة النموذج مستعينة بمجموعات بيانات محاكاة الصخور Synmars، وSimmars6k، ومجموعة بيانات صور كوريوسيتي MarsData-v2. كذلك تمت مقارنة دقة النموذج مع عدة طرق منها DeepLabv3+، وUnet++، وSegformer، وMarsnet. وتم تقييم الأداء باستخدام متوسط دقة البكسل، ونسبة الاسترجاع، ومؤشر التقاطع على الاتحاد، ونتائج التقييم أظهرت قدرة النموذج على التعرف الدقيق على الصخور، حيث بلغت الدقة ونسبة الاسترجاع أكثر من 90% على مجموعات بيانات المحاكاة، وكانت الدقة ونسبة الاسترجاع الأفضل على مجموعات البيانات الحقيقية.
关键词
المريخ; استخراج الصخور; الشبكة العصبية الالتفافية; المحول؛ استخراج الخصائص