يلعب التجزئة الدلالية لصور الاستشعار البعيد دورًا هامًا في مجالات مثل رصد التغيرات الحضرية، حماية البيئة، والتعرف على الكوارث الجيولوجية. لمعالجة مشكلة الفوات، الخطأ في الكشف، وعدم الاستخراج الكامل بسبب عوائق مثل الأشجار أو التداخل مع أشياء مشابهة في استخراج المباني من صور الاستشعار البعيد الحالية، يقترح هذا البحث شبكة محسنة لاستخراج المباني تعتمد على شبكة UNet -- شبكة اندماج الميزات المحلية والعالمية (Fusion of local global features network، FLGF-UNet). يضمن أسلوب دمج الميزات المتوازي في FLGF-UNet أن تتضمن ميزات كل مرحلة معلومات محلية دقيقة واعتمادية عالمية، مما يجعل تمثيلات الميزات في كل مرحلة تحتوي على معلومات محلية وعالمية في نفس الوقت، متغلبة بفعالية على نقص Transformer في تبادل المعلومات المحلية، ومتفوّقة على الشبكات التقليدية CNN في نمذجة المعلومات العالمية. بالإضافة إلى ذلك، لتعويض الفجوات الدلالية بين المشفر وفك المشفر، تم إدخال وحدة الدمج التفاعلي (Interactive Fusion، IF) بينهما لتعزيز اندماج التفاصيل المكانية، السياق العالمي، والميزات الدلالية. للتحقق من تفوق وشمولية FLGF-UNet، تمت مقارنة الشبكة المقترحة مع شبكات مثل U2Net، Swin Transformer، MA-Net، HD-Net وRS-Mamba على مجموعات بيانات WHU، Massachusetts، ومجموعات بيانات المباني النموذجية في المدن الصينية. النتائج أظهرت أن FLGF-UNet يتفوق في الأداء على شبكات SOTA الأخرى، ولديه قيمة تطبيقية عالية.
关键词
صور الاستشعار البعيد; استخراج المباني; شبكة اندماج الميزات المحلية والعالمية; دمج الميزات; وحدة الدمج التفاعلي