مع التطور السريع لتقنيات الاستشعار عن بعد، تم تطبيق حدة الصور البنيوية متعددة الأطياف على نطاق واسع في مجالات مثل استكشاف المعادن، تخطيط المدن، ورصد الكوارث الجيولوجية. ومع ذلك، تواجه الطرق الحالية للحدة البنيوية مشاكل في تعقيد الحساب بشكل كبير، بالإضافة إلى استخراج غير كافٍ للميزات المحلية والمعلومات الكلية أثناء دمج الصور البنيوية متعددة الأطياف. لذلك، تم بناء شبكة دمج تعتمد على الالتفافات ذات الإدراك الكلي (GAConv) وTransformer (GCTNet). تستخدم هذه الشبكة بنية فرعية متعددة المقاييس لاستخراج الميزات المكانية والطيفية لكل من الصور البنيوية والصور متعددة الأطياف، مع دمج وحدات GAConv وTransformer لالتقاط التفاصيل المحلية والسياق الكلي بفعالية، مما يحسن جودة الصور المدمجة. أظهرت النتائج التجريبية أن GCTNet يحقق أداءً متفوقًا مقارنة بالطرق المتقدمة الحالية في مهام حدة الصور البنيوية على مجموعات بيانات الاستشعار عن بعد المتعددة، مع تحسين ملحوظ في جودة الصور المدمجة وتقليل تعقيد حساب النموذج.
关键词
دمج الصور;معالجة صور الاستشعار عن بعد;حدة الصور البنيوية;التعلم العميق;Transformer;الالتفافات ذات الإدراك الكلي;تمثيل الميزات متعددة المقاييس;استخراج الميزات