توزيع الصخور الواسع على سطح المريخ يشكل تهديدًا محتملاً لسلامة سير المركبة الاستكشافية على المريخ، كما أن خصائص توزيع الصخور توفر مؤشرات مهمة لدراسة تطور الجيولوجيا في منطقة هبوط المريخ. ومع ذلك، تواجه التعرف على الصخور في صور المركبة الاستكشافية على المريخ تحديات متعددة: الضبابية في حواف الصخور والخلفية تجعل من صعوبة استخراج الcontours، وتشابه سمات نسيج السطح يؤد إلى أخطاء في التقدير، وقدرات النماذج التدريبية في الصخور الحقيقية من المريخ غير كافية. من أجل تحقيق التعرف الدقيق على الصخور في صور المركبة الاستكشافية على المريخ، يقدم هذا البحث نموذجًا لتعرف آلي على الصخور بناءً على شبكة الانتباه الذاتي التكرارية، محققًا تقسيمًا عالي الدقة للصور. يتبنى هذا النموذج تركيب مشفر - فكود، حيث يستند المشفر على شبكة عصبية تقوم بفصل سمات الصور، وتضع وحدة التركيز الذاتي المحسنة لتعزيز قدرة النموذج على تحسين المعلومات السياقية. أما بالنسبة للفكود، فهو مسؤول عن رسم خرائط السمات التي يقوم المشفر بفصلها إلى الفضاء الصوري، محققًا تقسيمًا دقيقًا. لاختبار أداء النموذج، قام البحث بتصنيف صور البعثة Zhurong على المريخ وقام بإنشاء مجموعة البيانات Tianwen، مع تحديد البيانات الخيالية Synmars، Simmars6k، بالإضافة إلى مجموعة بيانات MarsData-v2 لصور المركبة Curiosity واختبار وتحقق أداء النموذج. بالإضافة إلى ذلك، قام البحث أيضًا بمقارنة الدقة لهذا النموذج مع الأساليب المتعددة مثل DeepLabv3+، Unet++، Segformer، Marsnet. حيث تم استخدام معايار الدقة المتوسطة للبكسل، معدل الاسترجاع، معيار الاندماج للتقييم، وأظهرت النتائج أن هذا النموذج يمكنه التعرف بدقة على الصخور، حيث بلغت الدقة ومعدل الاسترجاع في مجموعة البيانات الخيالية ما يزيد عن 90٪ وفي مجموعة البيانات الحقيقية تعد الدقة ومعدل الاسترجاع الأفضل.
关键词
المريخ؛ استخراج الصخور؛ الشبكة العصبية الملتوية؛ المحول؛ استخراج السمات