نمط النقل بسبب قدرته القوية على نمذجة السمات العالمية وقدرته على تمثيل العلاقات طويلة المدى أصبح الآن مستخدمًا على نطاق واسع في مجال تصنيف مشاهد الصور البعيدة المشاهد ، ولكن هناك تحديات في الصور الفضائية مثل التعقيد الهيكلي الفضائي وتغير مقياس الهدف بشكل كبير ، ولا يمكن تجسيد معلومات مشاهد الصور الفضائية الفضائية في الفيت المباشر (رؤية المحولات) من خلال تقسيم الصور ذات الحجم الثابت والتمثيل العميق للميزات. يقوم هذا البحث بمقارنة أسلوب تصنيف الصور البعيدة المشهد على أساس مشاهد الصور البعيدة والتقاط الفترة المنقحة بتقسيمها إلى مكعبات صور بحجم كبير ، مما يسهل تصنيف صور مشاهد الأراضي البعيدة ؛ ثم ، استنادًا إلى آلية الاهتمام بالفئات وموديار تنقيح المناطق ، يكمل أسلوب تقسيم العنات مرة أخرى لصور مشاهد الأراضي البعيدة ، حيث يمكن أن يتم تصنيف صور مشاهد الأراضي البعيدة الأكثر تعقيدًا. في الوقت نفسه ، من أجل تحسين قابلية التمثيل العميق للميزات ، نحن ندخل THViT الإحصائية في رؤية عميقة عالية النظام احتمالاً عالية ، ومن الناحية النظرية الإحصائية ، يمكن أن نلتقط بشكل فعال تمثيلًا عميقًا مميزًا لصور مشاهد الأراضي البعيدة. بالإضافة إلى ذلك ، من أجل التغلب على القيود الناشئة عندما يكون شبكات المحولات المعمول بها تستخدم فقط العناصر المصنفة باعتبارها ميزات التصنيف ، فإن هذا البحث يدخل رموز الفئة ورموز الميزات عالية النظام على حد سواء باعتبارها ناقل ليستخدم ، مما يعزز أداء تصنيف مشاهد الصور البعيدة ويؤكد فعالية رموز الميزات عالية النظام في تصنيف مشاهد الصور البعيدة. نتائج التجارب تشير إلى: بالمقارنة مع خوارزميات ذات صلة مثل CFDNN و GLDBS و GAN و GCN و D-CapsNet و SCCov و ViT و Swin-T و LV-ViT-S و SCViT ، THViT لديه أداء متميز على كل من مجموعة بيانات NWPU45 (مجموعة بيانات NWPU-RESISC45) و AID (مجموعة بيانات الصور الجوية).
关键词
صور الفضاء ؛ تصنيف المشاهد ؛ شبكة المحولات ؛ تمثيل الميزات ؛ الميزات عالية النظام