L'utilisation d'images optiques et SAR pour l'estimation de la hauteur des bâtiments à partir de la télédétection est d'une grande importance pour comprendre la morphologie urbaine et optimiser l'utilisation de l'espace urbain existant. Cependant, les ensembles de données existants présentent plusieurs limitations : en raison du faible nombre d'échantillons, il est difficile de répondre aux besoins d'extraction d'informations par apprentissage profond, les zones couvertes par les échantillons sont limitées et ne fournissent pas suffisamment de diversité géographique ni de représentativité des caractéristiques spatiales, en particulier, il y a un manque notable de grands ensembles de données de hauteur des bâtiments pour la région chinoise. De plus, le manque d'ouverture des ensembles limite leur application et validation dans des recherches plus larges. Pour résoudre ces problèmes, cet article construit un ensemble de données BHDSI (Building Height Estimation Dataset Based on Sentinel Imagery) destiné à l'apprentissage profond, couvrant les centres urbains de 62 villes en Chine, avec un total de 5606 échantillons couvrant des scènes urbaines et rurales, ce qui en fait le plus grand ensemble de données de hauteur des bâtiments en Chine en termes de surface couverte. Cet ensemble contient des images Sentinel-1 et Sentinel-2 ainsi que les valeurs réelles de hauteur des bâtiments, avec des échantillons de taille 256×256, comparativement aux ensembles de taille 64×64, offrant une option précieuse pour la recherche en estimation de hauteur des bâtiments. Par rapport à d'autres ensembles, cet ensemble présente un grand nombre d'échantillons, une large couverture, une bonne accessibilité et une distribution raisonnable des hauteurs des bâtiments, répondant mieux aux besoins d'entraînement des réseaux d'apprentissage profond. Sur cette base, cet article évalue l'ensemble BHDSI et d'autres ensembles similaires avec le même réseau d'apprentissage profond, compare les performances de plusieurs réseaux sur la tâche de régression de la hauteur des bâtiments utilisant BHDSI, et analyse en profondeur les avantages et inconvénients de chaque réseau. Les résultats montrent que BHDSI offre de meilleures performances dans la régression de la hauteur des bâtiments comparé aux autres ensembles. Une analyse plus approfondie révèle que la précision est plus élevée dans les zones à basse hauteur lorsque BHDSI est utilisé. De plus, l'utilisation du décodeur U-Net pour entraîner le réseau d'estimation de la hauteur permet d'obtenir une précision supérieure. En résumé, l'ensemble BHDSI apporte un support important pour les recherches futures en estimation de la hauteur des bâtiments.
关键词
images sentinel; hauteur des bâtiments; ensemble de données; apprentissage profond; réseaux neuronaux convolutionnels