في مواجهة نقص بيانات ارتفاع المباني من خلال الاستشعار عن بعد في منطقة الصين الحالية، بنيت هذه الورقة مجموعة بيانات كبيرة موجهة نحو مهمة تقدير ارتفاع المباني باستخدام التعلم العميق. يحمل تقدير ارتفاع المباني باستخدام الصور البصرية والصناعية للمسافة الطويلة أهمية كبيرة في فهم شكل المدينة وتحسين المساحة الموجودة في المدينة. ومع ذلك، تواجه المجموعات الحالية العديد من القيود: بسبب أعداد العينات القليلة من الصعب تلبية الطلب على استخراج معلومات الاستشعار عن بعد باستخدام التعلم العميق، وتقتصر المناطق التي تغطيها العينات فيه على مناطق محدودة، وتفتقد إلى تمثيل متنوع جغرافي كافي وصفات مكانية، وبالأخص، تواجه نقصاً خطيراً في مجموعات بيانات ارتفاع المباني الكبيرة المخصصة لمنطقة الصين. بالإضافة إلى ذلك، تفتقر قابلية الوصول إلى المجموعات بيانات، مما يقيد استخدامها واختبارها بشكل أوسع في الأبحاث. لحل هذه المشكلات، بنينا في هذه الورقة، مجموعة بيانات تركز على تقدير ارتفاع المباني باستخدام بيانات BHDSI، تغطي مركز مدينة 62 مدينة في الصين، بإجمالي 5606 عينة، تغطي المدن والقرى وسيناريوهات أخرى، وهي أكبر مجموعة بيانات باستشعار ارتفاع المباني في منطقة الصين. تحتوي هذه المجموعة على صور بعيدة المدى من نوع Sentinel-1 وSentinel-2 باستشعار عن بعد وإلى قيم حقيقية لارتفاع المباني، حجم العينة هو 256 × 256، وقدمت خيارًا مهمًا وافرًا لدراسات تقدير ارتفاع المباني مقارنة بمجموعات بيانات بحجم 64 × 64، وتحتوي هذه المجموعة على كمية كبيرة من العينات، ونطاق تغطية واسع، وتوزيع معقول لارتفاع المباني، وبالتالي يمكن أن تلبي متطلبات تدريب شبكة التعلم العميق بشكل أفضل. استنادًا إلى هذا، قمنا في هذه الورقة بتقييم مجموعة بيانات BHDSI ومجموعات بيانات مماثلة أخرى باستخدام نفس الشبكات العصبية والعميقة، وقمنا بتحليل مقارن لأداء مختلف الشبكات عند استخدام مجموعة بيانات BHDSI في مهمة تقدير ارتفاع المباني، ثمننا النتائج. تشير الدراسات إلى أن مجموعة بيانات BHDSI تظهر أداءًا أفضل في مهمة تقدير ارتفاع المباني مقارنة بمجموعات البيانات الأخرى. ومن التحليل الأعمق وجدنا أن دقة تقدير ارتفاع المباني في المناطق ذات الارتفاع المنخفض أعلى عند استخدام مجموعة بيانات BHDSI. علاوة على ذلك، يمكن أن يحقق مدرب شبكة التعلم العميق من نوع U-Net دقة أعلى في تدريب شبكة تقدير ارتفاع المباني. تقدم هذه المجموعة البيانات والنتائج التجربية الدعم المهم للأبحاث المستقبلية في مجال تقدير ارتفاع المباني.