현재 중국 지역에서 건물 높이에 대한 원격 감지 데이터의 부족에 직면하여, 본 문서는 딥러닝을 이용한 건물 높이 추정 작업을 위한 대규모 데이터 세트를 구축했습니다. 광학 및 SAR 원격 감지 이미지를 사용한 건물 높이 추정은 도시 형태를 이해하고 도시 재고 공간을 최적화하는 데 중요합니다. 그러나 기존 데이터 세트에는 여러 가지 제한 사항이 있습니다. 샘플 수가 적어 딥러닝을 통한 원격 감지 정보 추출 요구를 충족시키기 어렵고, 샘플이 커버하는 지역이 제한적이며 지리적 다양성 및 공간적 특징의 충분한 표현성이 부족합니다. 특히, 중국 지역에 대한 대규모 건물 높이 데이터 세트가 부족합니다. 또한 데이터 세트의 접근성이 부족하여 연구에서 보다 넓은 응용 및 검증이 제한됩니다. 이러한 문제를 해결하기 위해 본 문서에서는 중국의 62개 도시의 중심 도시 지역을 포함한 총 5606 개의 샘플을 커버하는 BHDSI 데이터 세트를 사용한 건물 높이 회귀에 집중하는 데이터 세트를 구축했습니다. 본 데이터 세트에는 Sentinel-1 및 Sentinel-2의 원격 감지 이미지 및 건물 높이의 실제 값이 포함되어 있으며, 샘플 크기는 256×256입니다. 이는 64×64 크기의 데이터 세트와 비교했을 때 건물 높이 추정 연구에 중요한 보완적 선택지를 제공합니다. 본 데이터 세트는 다수의 샘플, 넓은 범위의 커버리지 및 합리적인 건물 높이 분포를 가지고 있어 딥러닝 네트워크의 훈련 요구를 보다 효과적으로 충족합니다. 이를 바탕으로 본 문서에서는 동일한 딥러닝 네트워크를 사용하여 BHDSI 데이터 세트와 기타 유사한 데이터 세트를 평가하고, BHDSI 데이터 세트를 사용하여 건물 높이 회귀 작업을 수행할 때 여러 네트워크의 성능을 비교했으며 결과를 분석했습니다. 연구 결과는 다른 데이터 세트와 비교하여 BHDSI 데이터 세트가 건물 높이 회귀 작업에서 더 우수한 성능을 나타냅니다. 더 깊은 분석을 통해, BHDSI 데이터 세트를 사용하면 낮은 건물 높이 지역의 추정 정확도가 상대적으로 더 높음을 발견했습니다. 또한, 건물 높이 추정 네트워크의 훈련에 U-Net 디코더를 사용하면 더 높은 정확도를 얻을 수 있음을 발견했습니다. 본 데이터 세트 및 실험 결과는 미래 건물 높이 추정 분야의 연구에 중요한 지원을 제공합니다.